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内 容 人 简介 

Rust 是 一 门 利 用 现代 化 的 类 型 系统 ， 有 机 地 融合 了 内 存 管 理 、 所 有 
权 语 义 和 混 合 编程 范 式 的 编程 语言 。 它 不 仅 能 科学 地 保证 程序 的 正确 
性 ， 还 能 保证 内 存 安 全 和 线程 安全 。 同 时 ， 还 有 能 与 C/C++ 语言 媲美 的 
性 能 ， 以 及 能 和 动态 语言 媲美 的 开发 效率 。 

本 书 并 非 对 语法 内 容 进 行 简单 罗列 讲解 ， 而 是 从 四 个 维度 深入 全 面 
且 通 透 地 介绍 了 Rust 语 言 。 从 设计 哲学 出 有 发， 探索 Rust 语 言 的 内 在 一 致 
性 ;从 源码 分 析 入 手 ， 探 索 Rust 地 道 的 编程 风格 ; 从 工程 角度 着 手 ， 探 
索 Rust 对 健壮 性 的 支持 ;从 底层 原理 开始 ， 探 索 Rust 内 存 安全 的 本 质 。 

KPM J Rust 2018 的 特性 ， 适 合 有 一 定编 程 经 验 日 想 要 学 习 Rust 
的 初学 者 ， 以 及 对 Rust 有 一 定 的 了 解 ， 想 要 继续 深入 学 习 的 进 阶 者 。 


未 经 许可 ， 不 得 以 任何 方式 复制 或 抄 表 本 书 之 部 分 或 全 部 内 容 。 
和 版权 所 有 ， 侵 权 必 有 气 。 
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yi 
推 存 序 一 

Even though I had to read this book through Google Translate, The Tao 
of Rust is an extremely interesting book.It starts off explaining exactly why it 
is different:it's a book that gets you to think about Rust,and its perspective on 
the world.I only wish I could read it in its native tounge,as I'm sure it's even 
better then!I have been working on Rust for six years now,and this book 
changed my perspective on some aspects of the language.That's very 
powertul! 

即便 我 不 得 不 通过 谷歌 翻 详 阅 读 这 本 书 ， 但 也 不 难 友 现 《Rust 编 程 
之 但 》 是 一 本 非 党 有 趣 的 书 。 它 解释 了 Rust 为 何 与 众人 不同 : 这 本 书 可 以 
让 你 思考 Rust， 以 及 Rust 语 言 所 给 人 台 的 世界 观 。 我 好 和 希望 能 读 情 中 文 原 
版 书 ， 因 为 我 相信 它 会 更 精彩 ! ROANNE Rust 的 相关 工作 六 年 了 ， 这 
本 书 改变 了 我 对 Rust 语 言 的 茶 些 看 法 。 这 非 第 强大 ! 
Steve Klabnik，Rnust 官 方 核心 团队 成 员 及 文档 团队 负 贡 人 
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I knew Rust was a notoriously difficult programming language to 
learn,but it wasn't until I read the preface to The Tao of Rust ,by Alex 
Zhang,that I realized why it is so difficult.Alex writes: 


Rust covers a wide range of knowledge,including object- 
oriented,functional programming, generics,underlying memory 
management,type systems,design patterns,and more. 


Alex covers all of these topics and more in The Tao of Rust .A single 
text that ties all of this together will be invaluable for Rust learners.So far I've 
read a couple of chapters translated from the original Chinese,and I can't wait 
to read more. 

Rnust 语 言 难 学 ， 这 已 经 是 众所周知 的 了 。 但 是 直到 我 看 到 Alex GK 
MAR) 的 《Rust 编 程 之 道 》 的 前 言 时 ， 我 才 明 日 它 为 什么 如 此 难 学 ， 
Alex 写 过: 

“Rust = WRIA SES) Z, ie SADT RR. PRAT iz 
A RENFE, RAL ARS. KIRATA. ” 

(Rustin Zia) — Pm SATA RHEE RIAA A, HERRE N 
AA NHK ARTE E, XX Rusti) OR LEE a eA. PK Ae 
了 本 书 部 分 内 容 的 英文 译 稿 后 ， 就 已 经 迫不及待 地 想 要 阅读 更 多 的 内 容 
E 
Patrick Shaughnessy, <Ruby F HHJ) 原音 作 者 
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HELE AP Z 

三 年 前 ， 当 我 们 雇 定 为 TiDB 开 发 目 有 的 分 布 式 key-value 存 储 系统 
TiKV 时 ， 我 们 首先 要 面 对 的 驶 是 选择 什么 语言 的 问题 。 当 时 ， 提 在 我 
们 面前 的 有 多 个 选择 : Go、C++、Java 和 Rust。 在 仔细 评估 之 后 ， 我 们 
决定 使 用 Rust， 虽 然 那 时 候 Rust 并 没有 太 多 成 功 的 项 目 双 例 。 我 清晰 地 
记得 当时 选择 一 门 语言 的 条 件 如 下 。 

”我 们 需要 一 门 安全 的 语言 ， 让 我 们 处 理 内 存 和 多 线程 的 时 候 更 加 
WAAR AR, AAPOR WE eae. BE AS Il el. 

”我们 需要 一 门 高 性 能 的 静态 语言 ， 以 便 更 好 地 与 内 存 、CPU 打 区 
道 ， 不 用 担心 GC 引起 的 延 运 突然 上 升 等 问题 。 

”我 们 需要 一 个 强大 的 包 和 党 理 系 统 ， 以 避免 陷入 编 详 构建 工具 的 细 
节 中 ， 也 不 用 为 官 理 多 个 版 本 的 库 而 发 私 。 

”我 们 需要 一 个 友善 的 社区 ， 在 需要 时 能 从 这 个 社区 得 到 帮助 ， 与 
大 家 一 起 成 长 。 

以 上 这 些 条 件 ，Rust 全 部 满足 。 事 实 也 没有 让 我 们 失望 。 我 们 使 用 
Rust Ri TIKV RET SIAR. BUTE, TiKV 不 仅 关 量 用 在 生产 环境 
中 ， 还 进入 了 CNCF 基金 会 ， 成 为 了 一 个 在 Cloud 上 面 构建 其 他 服务 的 
原生 基础 组 件 。 

但 是 ， 我 们 使 用 Rust 的 历程 并 不 是 一 帆 风 顺 的 。 在 早期 ，Rust 相 关 
的 文档 非常 稀 忠 ， 网 上 也 没有 很 好 的 参考 资料 ， 更 别提 专业 系统 有 的 Rust 
书籍 了 。 上 所 以 ， 当 我 拿 到 汉 东 同学 的 《Rust 编 程 之 道 》 时 ， 我 是 非常 兴 
盏 的 。 本 书 不 仪 介绍 了 Rust 的 基础 知识 ， 还 详细 地 解释 上 Rust 里 面 非 
第 难以 理解 的 所 有 权 系 统 、 内 存 模 型 、 并 发 编程 等 特性 。 尤 其 是 所 有 权 
这 个 概念 ， 对 很 多 同学 来 说 ， 所 有 权 融 是 从 其 他 语言 切换 到 Rust 的 第 一 
个 拦 路 席 ， 而 汉 东 同学 在 本 书 中 进行 了 细致 清晰 的 讲解 ， 相 信 大 家 会 有 
一 种 “ 哦 ， 原 来 如 此 ”的 感慨 。 更 难 能 可 贯 的 是 ， 本 书 还 从 工程 角度 讲解 
了 如 何 使 用 Rust 来 编写 健壮 的 应 用 程序 ， 提 升 产 品质 量 。 

Rust 是 一 门 相 对 难 学 的 语言 ， 我 个 人 认为 它 的 学 习 曲 线 比 C++ 的 学 
习 曲 线 更 陡峭 ， 但 我 相信 ， 通 过 《Rust 编 程 之 道 》， 大 家 能 快速 掌握 


Rust， 体 验 使 用 Rust 编 程 的 乐趣 ， 也 能 更 快 地 在 项 目 中 使 用 Rust 来 保证 
程序 的 健壮 性 。 如 果 你 轴 到 了 困难 ， 不 用 害 介 ， 你 可 以 很 方便 地 从 Rust 
社区 得 到 帮助 。 

欢迎 来 到 Rust 的 世界 ! ! ! 

一 一 唐 刘 ，PingCAP 首 席 架 构 师 ，TiKV 负 责 


ji 


当 我 2015 年 开始 学 习 Rust 的 时 候 ， 我 绝对 没有 和 想 过 要 写 一 本 Rust 编 
FEHB 

缘起 

当时 我 哆 刚 翻 详 完 《Ruby 上 原理 放 术 》 一 书 ， 开 始 对 辰 层 开 及 产生 了 
一 点 点 兴趣 。 从 2006 年 入 行 以 来 ， 我 瓯 一 二 和 动态 语言 打交道 。 虽 然 目 
己 也 想 学 习 拘 层 开 发 ， 但 能 选择 的 语言 儿 乎 只 有 C++。 我 在 学 校 里 浅 浅 
地 学 过 ”C++ 这 门 语 言 ， 也 许 是 第 一 印象 作怪 ， 总 难以 提起 对 C++ 的 兴 
趣 。 

“Rust 1.0 及 布 时 ， 我 去 官方 网 站 了 解 了 一 下 Rust 语 言 ， 及 现 它 的 主 
要 特点 有 以 下 几 方 面 : 

系统 级 语言 

- 无 GC 

基于 LLVM 

ALE 

- 强 类 型 + 静态 类 型 

Hea Fa EYIN 

` 2 MAST RR 

: 线程 安全 

我 一 下 子 葡 和 被 这 些 鲜明 的 特性 “ 击 中 了， 从 此 开始 了 Rust 的 学 习 。 

再 一 砍 受 上 编程 

第 一 次 爱 上 编程 是 在 上 小 学 时 。 父 杀 给 我 买 回来 一 台 金 字 塔 学习 
机 ， 这 人 台 学 习 机 有 两 种 功能 ， 一 种 是 学 习 Logo 语 言 ， 为 一 种 古玩 卡带 游 
戏 。 编 号 Logo 语 言 束 是 用 小 海 多 画图， 也 许 是 因为 太 早 了 ， 也 许 是 因为 
没有 人 引导 ， 那 时 的 我 选择 了 痛快 地 玩 游戏 。 忌 想 看 先 玩 游戏 ， 册 去 学 
怎么 编程 ， 人 然后 还 幻想 着 能 不 能 用 Logo 语言 编写 一 个 游戏 。 其 实 这 时 
修 的 我 对 编程 更 多 的 是 一 种 懂 避 ， 并 没有 在 学 习 编 程 上 付出 更 多 的 实际 


行动 。 

第 二 次 爱 上 编程 是 在 大 学 初次 学 习 C 语 言 的 时 候 。 我 本 可 以 选择 计 
算 机 科学 专业 ， 但 是 最 后 还 是 选 了 电子 信息 科学 与 技术 专业 。 这 样 选 是 
因为 我 想 把 软 便 件 都 学 了。 想法 是 好 的 ， 可 异 实 施 起 来 并 不 容易 。 最 后 
的 结果 束 是 ， 软 便 件 部 没 学 好 。 

第 三 次 爱 上 编程 是 在 过 到 Ruby 语 言 的 时 候 。 当 时 我 在 用 Java， 并 且 
己 经 完全 陷入 了 了 Java 语言 和 Web 框 架 纷 楷 复 杂 的 细 贡 中 ， 痛 吉 不 雯 。 
Ruby on Rails 框 架 的 模 空 出 世 ， 把 我 从 这 种 状态 中 解救 了 出 来 。Ruby 语 
言 的 优雅 和 目 由 ， 以 及 “让 程序 员 更 快乐 ”的 口号 深 深 地 吸引 了 我。 这 一 
次 我 是 真正 爱 上 了 编程 ， 并 且 积 极 付 诸 行动 去 学 习 和 提升 目 己 。 此 时 也 
恰 着 互联 网 创业 大 潮 的 开始 ，Ruby 语 言 的 开发 效率 让 它 迅速 成 为 创业 公 
司 的 宠儿 ， 因 此 ， 我 也 借 着 Ruby 这 门 语言 参与 到 了 这 股 创业 洪流 中 。 

第 四 次 爱 上 编程 是 在 过 到 Rust 的 时 候 。 此 时 ， 创 业 潜 流 已 经 退潮 。 
技术 圈 有 句 话 ， 叫 “十 年 一 轮回 ”。 当 年 喜欢 Ruby 给 开 及 过 程 市 来 的 快 
乐 ， 但 是 随 寿 时代 的 变 车 和 业务 规模 的 增长 ， 我 不 座 开 始 重 新 思考 一 个 
问题 : 何谓 快乐 ”真正 的 快乐 不 仅仅 是 与 代码 时 的 “ 酸 磷 ”， 更 应 该 是 代 
但 部 署 到 生产 环境 之 后 的 “安稳 ?”。Rust 恰 恰 可 以 给 我 带 来 这 种 “双重 快 
乐 ” 体 验 。 

为 什么 是 Rust 

社区 中 有 人 模仿 阿 西 芮 夫 的 机 器 人 三 大 定律 ， 总 结 了 程序 的 三 大 定 
侍 LL], 

: 程序 必须 正确 。 

` 程序 必须 可 维护 ， 但 不 能 违反 第 一 条 定律 。 

` 程序 必须 高 效 ， 但 不 能 违反 前 两 条 定律 。 

程序 的 正确 性 ， 一 方面 可 以 理解 为 该 程序 满足 了 实际 的 问题 需求 ， 
男 一 方面 是 指 满足 了 它 目 里 的 程序 规约 。 那 么 如 何 保证 程序 的 正确 性 
呢 ? 首先 ， 可 以 通过 对 程序 的 各 种 测试 、 断 言 和 钳 误 处 理 机 制 ， 来 体 证 
其 满足 实际 的 问题 需求 。 其 次 ， 在 数学 和 计算 机 科学 已 经 融合 的 今天 ， 
通过 较为 成 玖 的 类 型 理论 即 可 保证 程序 目 喘 的 规约 正确 。 

LAIR EARS AY Ruby 语言 为 例 ， 程 序 的 正确 性 必须 依赖 于 开发 者 的 
水 平 ， 并 需要 大 量 的 测试 代码 来 保证 正确 性 。 即 便 在 100% 测 试 履 新 率 


的 条 件 下 ， 也 经 单 会 过 到 NilError 之 类 的 空 指针 问题 。 也 残 是 说 ，Ruby 
程序 目 身 的 正确 性 还 没有 得 到 保证 。 以 此 类 推 ，C、C++、Python、 
Java、JavaScript 等 语言 都 有 同样 的 问题 。 

而 国 数 了 式 编 程 语 言 在 这 方面 要 好 很 多 ， 尤 其 是 号 称 纯 函 数 式 的 
Haskell 语言， 它 具 有 融合 了 范 畴 理论 的 类 型 系统 ， 利 用 了 范畴 理论 自 
里 的 代数 性 质 和 定律 你 证 了 程序 目 壬 的 正确 性 。 然 而 ，Haskell 也 有 比较 
明显 的 缺点 ， 比 如 它 不 满足 上 述 第 三 条 定律 ， 运 行 效 率 不 高 。 

反观 Rust 语 言 ， 对 程序 的 三 定律 文 持 得 恰到好处 。 它 信 鉴 了 了 Haskell 
的 类 型 系统 ， 保 证 了 程序 的 正确 性 。 但 还 不 止 于 此 ， 在 类 型 系统 的 基础 
上 ，Rust 信 和 监 了 现代 C++ 的 内 存 党 理 机 制 ， 建 这 了 所 有 权 系 统 。 不 仅 保 
证 了 类型 安全 ， 还 保证 了 内 存 安 全 。 同 时， 也 解决 了 多 线程 并 发 编程 中 
的 数据 竞争 问题 ， 默 认 线 程 安全 。 有 再 来 看 代码 的 可 维护 性 ，Rust 代 码 的 
可 谍 性 和 抽象 能 力 都 是 一 流 的 。 不 仅 拥 有 高 的 开 友 效率 ， 还 拥有 可 以 和 
C/C++ 娘 美的 性 能 。 当 然 ， 疫 有 银 弹 ， 但 Rust 束 是 我 目前 想 要 的 语言 。 

目前 Rust 被 陆续 应 用 在 区 块 链 、 游 戏 、WebAssembly 扩 术 、 机 和 需 学 
习 、 分 布 式 数据 库 、 网 络 服务 基础 设施 、Web 框 架 、 操 作 系 统 和 般 入 去 
等 领域 。 时 代 在 变化 ， 未 来 的 互联 网 需要 的 是 安全 和 性 能 并 重 的 语言 ， 
Rust 必 然 会 在 其 中 大 放 异 彩 。 

学 习 Rust 市 来 了 什么 收获 

Rust 是 一 门 现代 化 的 语言 ， 融 合 了 多 种 语言 特性 ， 而 且 Rust 语 言 可 
以 应 用 的 领域 疙 围 非常 三 沁 。 在 学 习 Rust 的 过 程 中 ， 我 发 现 目 己 的 编程 
能 力 在 很 多 方面 存在 短 板 。 突 人 破 这 些 短 板 的 过 程 实际 上 就是 一 次 日 我 提 
升 的 过 程 。 

Rust 是 一 门 成 长 中 的 新 语言 ， 学 习 Rust， 跟 随 Rust 一 起 成 长 ， 可 
以 体验 并 参与 到 一 门 真正 工业 化 语言 的 发 展 进 程 中 ， 感 沉 束 像 在 创造 历 
史 。 虽 然 我 并 未 给 Rust 语 言 提 交 过 PR， 但 也 为 Rust 语 言 和 社区 多 次 提交 
过 Bug， 以 及 文档 和 工具 的 改进 意见 。 

Rust 自 二 作 为 一 个 开源 项 目 ， 算 得 上 是 开源 社区 中 的 “明星 ”项 目 
了 了 。 和 学 习 Rust 的 过 程 加 深 了 我 对 开源 社区 的 认识 ， 也 开拓 了 我 的 眼界 。 

为 什么 要 写 这 本 书 

在 学 习 Rust 一 年 之 后 ， 我 与 下 了 《如 何 学 习 一 门 新 语言 》 一 文 ， 其 


Hoe SFR Ruste, a CRM EE. THIET Ae ii SCE 
ET ECA ee AS XY PB PRB) S R, HA Ta) cE A WA — AN Rustin 
程 的 书籍 。 我 当时 也 正 想 通过 一 本 书 来 完整 地 表达 目 己 的 学 习 心 得 ， 再 
加 上 中 文 社 区 中 没有 较 全 面 系统 的 Rust 书 籍 ， 于 是 ， 一 担 即 合 。 

与 书 的 过 程 可 以 形容 为 痛 并 快乐 看 。Rust 语 言 正 值 成 长 期 ， 很 多 语 
言 特性 还 在 不 断 地 完善 。 举 一 个 极 病 的 例子 ， 比 如 写 下 某 段 代码 示例 并 
成 功 编译 后 ， 过 了 三 天 却 发 现 它 无 法 编 详 通过 了 。 于 是 ， 我 再 一 次 跟 进 
Rust 的 RFC、 源 码 、ChangeLog 去 看 它们 的 变更 情况 ， 然 后 再 重新 修订 
代码 示例 。 这 个 过 程 虽然 痛 否 ， 但 改 完 之 后 会 发 现 Rust 的 这 个 改进 确实 
是 有 必要 的 。 在 这 个 过 程 中 ， 我 看 到 了 Rust 的 成 长 ， 以 及 Rust 团 队 为 保 
证 语言 一 伊 性 和 开发 者 的 开发 体验 所 付出 的 努力 ， 让 我 感觉 目 己 伦 再 多 
时 间 和 精力 去 修改 本 书 的 内 容 都 是 值得 的 。 

话说 回来 ， 任 何人 做 事 都 是 有 动机 或 目的 的 ， 我 也 不 例外 。 我 与 这 
本 书 的 目的 主要 有 以 下 三 个 。 

: 为 Rust 中 文 社区 市 来 一 本 真正 可 以 全 面 系统 地 学 习 Rust 的 书 。 

. 以 教 为 学 。 在 写作 的 过 程 中 ， 让 目 己 所 学 的 知识 进一步 内 化 。 

传播 一 种 目 学 方法 。 本 书 内 容 以 Rust 语 言 的 设计 哲学 为 出 发 点 ， 
按照 从 整体 到 细 市 的 思路 逐个 阐述 每 个 语言 尾 性 ， 锅 望 读 者 可 以 产生 共 
HY, 。 

结语 

我 目 己 作为 本 书 的 第 一 位 该 者 ， 目 前 对 这 本 书 是 非常 满意 的 。 课 心 
布 望 每 一 位 谈 者 都 能 从 本 书 中 收获 新 知 。 当 然 ， 我 也 知道 不 可 能 让 每 一 
位 谈 者 都 满意 。 在 我 看 来 ， 与 书 不 仅 是 在 传播 知识 和 思想 ， 更 是 一 种 区 
流 和 沟通 。 所 以 ， 当 你 不 满意 的 时 候 ， 可 以 来 找 我 交流 ， 提 出 更 多 建设 
性 意见 ， 帮 助 我 成 长 。 我 争取 在 写 下 一 本 书 的 时 候 ， 让 更 多 的 人 满意 。 
而 且 ， 如 果 你 的 建议 确实 中 肯 ， 让 我 得 到 了 成 长 ， 我 也 为 你 准备 了 不 错 
的 小 礼物 。 





[1] https://medium.com/@schemouil/rust-and-the-three-laws-of-informatics-4324062b322b 
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ERRIA Rusti, Æ EN ERE AY Fa E Rust 
习 曲 线 陡 ?。 已 丝 有 一 定编 程 经 验 的 人 在 学 习 一 门 新 语言 时 ， 都 喜欢 十 
接 上 手写 代码 ， 因 为 这 样 可 以 快速 体验 这 门 语言 的 特色 。 对 于 大 多 数 语 
言 来 襄 ， 这 样 确实 可 以 达到 一 定 的 学 习 目 的 。 但 是 当 他 们 在 初次 学 习 
Rust 的 时 候 ， 融 很 难 通过 直接 上 手 来 体验 这 种 快感 。 

我 第 一 次 学 习 Rust 时 束 遇 到 了 这 样 的 情况 。 我 按 以 往 的 编程 经 验 下 
接 写 下 了 代码 ， 但 古 编译 无 法 通过 ; 可 是 有 时 候 们 单调 换 两 行 代码 的 顺 
序 ， 程 序 下 能 顺利 编 详 成 功 了 ， 这 让 我 非常 困惑 。 我 想 这 也 是 大 多 数 人 
感觉 “Rust 学 习 曲 线 陡 ”的 原因 吧 。 经 过 和 Rust 编 详 项 的 多 次 “斗争 ”之 
后 ， 我 不 得 不 重新 反思 目 己 的 学 习 方法 。 看 样子 ，Rnust APES SR 
种 规则 ， 只 要 程序 员 违 反 了 这 些 规则 ， 它 束 会 检查 出 来 并 阻止 你 。 这 束 
意味 看 ， 作 为 程序 员 ， 你 必须 主动 理解 并 过 守 这 些 规则 ， 编 译 费 才能 和 
你 “化 政 为 友 ”。 

所 以 ， 我 束 开 始 了 对 Rust 的 第 二 轮 学 习 ， 息 挥 目 己 以 往 的 所 学 ， 抱 
APS NAS, METIS Rust. YAM, FEFA RKA fal 
单 。 

Rust 官 方 虽然 提供 了 Rust Book, {Hse WN AI ZAZA ANA, EAS 
束 是 对 知识 点 的 罗列 ， 系 统 性 比较 鼻 。 后 来 官方 也 意识 到 了 这 个 问题 ， 
推出 了 第 2 版 的 Rust Book ， 内 容 组 织 方 面 改善 了 很 多 ， 对 学 习 者 也 非 沼 
友好 ， 但 系统 性 还 是 莽 了 点 。 后 来 又 看 了 国内 Rust 社 区 组 织 群 友 们 合 浇 
的 Rust Primer ， 以 及 国外 的 Programrmming Rust ， 我 才 对 Rust 建 立 了 基本 
的 认 知 体系 。 

直到 此 时 ， 我 才 意 识 到 一 个 重要 的 问题 : Rust H AR EAR AS SE 
因 在 于 Rust 语 言 融合 了 多 种 语言 特性 和 多 种 编程 范式 。 这 允 意 味 独 ， 
Rusty KAJAR SE AS) yz, ae SMR AR. PRL, ZA, RE 
ATEH, RM AS. Were AR. MRES ERR, MANEI 
工程 化 健壮 性 ， 无 所 不 包 。 可 以 说 ，Rust 十 编程 语言 发 展 至 今 的 集大成 
者 。 对 于 大 多 数 Rust 语 言 的 初学 者 来 说 ， 他 和 擎 握 的 知识 体系 范围 是 小 于 
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合 。 
我 在 学 习 Rust 之 前 ， 所 掌握 的 编程 语言 知识 体系 大 多 是 和 拥有 GC 
的 动态 语言 相关 的 ， 对 于 确 层 内 存 管 理 知之 其 少 。 所 以 在 我 学 习 Rust 所 
有 权 的 时 候 ， 束 很 难 理解 这 种 机 制 对 于 内 存 安全 的 意义 所 在 ;而 我 所 认 
识 的 一 些 拥 有 C 语言 编程 经 验 的 朋友 ， 在 学 习 Rust 时 面临 的 问题 是 ， 
难以 理解 Rust 文 持 的 上 层 抽 象 ， 对 他 们 来 说 ，Rust 中 融合 的 类 型 系统 和 
编程 范 陈 束 是 他 们 学 习 道 路 上 的 “拦路 席 ”: 对 于 拥有 Haskell “ek 2x 
编程 经 验 的 朋友 ， 会 感觉 Rust 的 类 型 系统 很 容易 理解 ， 但 是 请 层 的 内 存 

党 理 和 所 有 权 机 制 又 成 了 需要 克服 的 学 习 障 人 阴 ; 来 目 C++ 编 程 圈 的 朋 
友 ， 尤 其 是 懂 现 代 C++ 的 朋友 ， 对 Rust 所 有 权 机 制 理解 起 来 几乎 没有 困 
难 ， 但 是 类 型 系统 和 图 数 式 编程 范式 可 能 会 阻 但 他 们 的 学 习 。 当 然 ， 如 
果 正 好 你 没有 上 述 情况 ， 那 说 明 你 的 相关 知识 体系 已 经 很 全 面 了 ， 你 在 
Rust 的 学 习 之 路 上 将 会 非常 顺利 。 

RENE Ree, TEX) Rust Al i ie Se See? 答 
REREH. 

Rust 编 程 语 言 虽然 融合 了 很 多 其 他 语言 的 特性 和 范式 ， 但 它 不 是 进 
行 简单 的 内 容 扒 登 ， 而 是 有 机 地 融合 了 它们 。 也 束 是 说 ，Rust 这 循 看 高 
度 的 一 致 性 内 核 来 融合 这 些 特 性 。 我 们 只 需要 从 Rust 的 设计 哲学 出 及 ， 
牢 牢 地 把 握 它 的 设计 一 臻 性， 就 可 以 把 它 的 所 有 特性 都 串 起 来 ， 从 而 达 
到 掌握 它 的 目的 。 这 正 古本 书 有 和 人 循 的 写作 他 辑 。 

KPIA 

Arit HEBR, RR Rust 语言 的 内 在 一 致 性 witt æi] 
优秀 编程 语言 保持 语言 一 致 性 的 关键 所 在 。 设 计 哲 学 是 语言 特性 和 语法 
要 叉 设 计 的 诱因 和 准则 。 理 解 Rust 语 言 的 设计 哲学 ， 有 助 于 把 握 Rust 语 
言 的 内 核 与 一 致 性 ， 把 Rust 看 似 纷 党 复杂 的 特性 都 系统 地 串 起 来 。 

从 源码 分 析 入 手 ， 探 索 Rust 地 道 的 编程 风格 。Rust 是 一 门 目 举 的 
语言 ， 也 束 是 说 ，Rust 语 言 由 Rust 目 有 身 实 现 。 通 过 疯 谈 Rust 标 准 库 和 一 
些 第 三 方 库 的 源 伍 ， 不 仅 可 以 深入 理解 Rust 担 供 的 数据 茯 型 和 数据 结 
构 ， 更 能 体验 和 学 习 地 道 的 Rust 编 程 风 格 。 

TEAR GE, FRA Rust 对 健壮 性 的 支持 . Rust 通过 类 型 系 


2. Wa. Fa RARER Se Lill PRUE A TEZER, RUE ST ABSA HEE 
性 。 从 工程 角度 去 看 Rust， 才 能 看 到 Rust 对 系统 健壮 性 的 文 持 是 多 么 优 
HEE o 

从 故 层 原理 开始 ， 探 索 Rust 内 存 安 全 的 本 质 ” 。 只 有 深入 底层 ， 才 
能 理解 Rust 所 有 权 机 制 对 于 内 存 安 全 的 曹 义 。 而 且 可 以 进一步 理解 Rust 
的 类 型 系统 ， 以 及 Unsafe Rust 存 在 的 必要 性 。 

ea HF VS 

适合 本 书 的 读者 群体 包括 : 

“ 有 一 定编 程 经 验 ， 想 要 学 习 Rust 的 初学 者 。 

- 对 Rust 有 一 定 了 解 ， 还 想 对 Rust 深 入 学 习 的 进 阶 者 。 

本 书 不 适合 完全 没有 有 编程 基础 的 人 和 学习。 

如 何 阅 读本 书 

对 于 Rust 彻 学 者 ， 建 议 按 照章 市 顺 友 去 阅读 。 因 为 本 书 每 一 间 内 容 
基本 都 依赖 于 前 一 和 草 内 容 的 前 置 知 识 。 

对 于 Rust 有 一 定 了 解 的 朋友 ， 可 以 选择 你 感 兴 趣 的 章节 去 疯 旋 。 
为 本 书 的 每 一 章 也 是 对 一 个 性 直 主题 的 深入 探讨 。 

一 些 章节 的 开头 罗列 出 了 通用 概念 ， 这 是 为 了 更 通 透 地 讲解 相关 知 
识 的 来 龙 去 脉 。 如 果 你 对 这 部 分 内 容 不 了 解 ， 那 么 建议 你 把 这 部 分 内 容 
(属于 前 置 知 识 ) 认真 看 完 再 去 看 后 面 的 内 容 。 如 果 你 对 这 部 分 内 容 已 
经 有 了 充分 的 了 解 ， 那 么 完全 可 以 跳 过 ， 下 接 选 择 你 最 关心 的 内 容 去 疯 
ee 

章 攻 概述 

第 1 章 新 时 代 的 语言 。 这 一 半 将 从 Rust 语 言 的 发 展 历 史 概 述 开 始 ， 
引出 Rust 的 设计 哲 尝 ， 通 过 设计 藻 学 进一步 前 述 Rust 的 语言 架构 。 访 语 
言 架 构 也 是 本 书 组 织 内 容 时 夫人 循 的 准则 之 一 。 这 一 章 还 将 介绍 Rust 语 
言 社 区 的 现状 和 未 来 展望 。 最 香 要 有 的 是 ， 这 一 章 将 介绍 Rust 代 码 的 执行 
流程 ， 这 对 于 理解 本 书后 面 的 章节 会 有 所 帮助 。 

第 2 章 语言 精 要 。 学 习 任 何 一 门 语言 时 ， 首 先 要 做 的 就 是 了 解 其 
语法 。 这 一 章 将 罗列 Rust 语 言 中 的 常用 语法 ， 但 不 是 简单 罗列 ， 而 古 巡 
循 一 定 的 逻辑 进行 罗列 。 在 介绍 语法 之 前 ， 这 一 章 会 先 对 Rust 语 言 的 基 


本 构成 做 整体 概述 。 然 后 将 介绍 一 个 非常 重要 的 概念 : 表达 式 。 它 是 
Rust 语 法 志和 人 循 的 最 简 早 的 准则 之 一 。 接 下 来 才 会 依次 介绍 Rust 中 最 第 用 
的 语法 ， 让 读者 对 Rust 语 言 有 一 个 初步 的 了 解 。 

第 3 章 类 型 系统 。 类 型 系统 是 现代 编程 语言 的 重要 文 柱 。 这 一 章 
自 先 将 以 通用 概念 的 形式 介绍 类 型 系统 相关 的 概念 ， 目 的 是 帮助 不 了 解 
类 型 系统 的 谈 者 建立 初步 认 知 。 接 下 来 将 从 三 方面 曾 述 Rust 的 类 型 系 
统 。 为 了 理解 Rust 基 于 栈 来 管理 资源 的 思想 ， 有 必要 先 了 解 Rust 中 对 次 
型 的 分 类 ， 比 如 可 确定 大 小 闫 型 、 动 态 大 小 类 型 和 零 大 小 关 型 等 。 这 一 
章 还 将 介绍 Rust 类 型 推导 功能 及 其 不 足 。 接 下 来 将 介绍 Rust 中 的 汉 型 编 
程 。 泛 型 是 Rust 关 型 系统 中 最 重要 的 一 个 概念 。 最 后 会 介绍 Rust 的 “ 灵 
Be”, trait 系统 。 对 类 型 系统 建立 一 定 的 认 知 ， 有 利于 学 习 后 面 的 内 
容 。 

第 4 章 AFH 。 这 一 章 首 先 将 介绍 撒 层 内 存 管理 的 通用 概念 。 
在 此 基础 上 上， 围绕 内 存 安 全 这 个 核心 ， 从 变量 定义 到 知 能 指针 ， 逐 渐 闻 
述 Rust 中 资源 管理 的 哲学 。 这 部 分 内 容 是 真正 理解 Rust 所 有 权 机 制 的 基 
fiti o 

第 5 半 所 有 权 系 统 。 这 一 重 首 先 会 介绍 关于 值 和 引用 语义 的 通用 
概念 ， 然 后 在 此 基础 上 探讨 Rust 的 所 有 权 机 制 。 读 者 将 看 到 ，Rust 如 何 
结合 类 型 系统 和 发 层 内 存 客 理 机 制 ， 以 及 上 层 值 和 引用 的 语义 形成 现在 
的 Rust 有 所有权 系统 。 然 后 ， 进 一 步 围 纯 内 存 安 全 的 核心 ， 曾 述 借用 检查 
和 生命 周期 参数 的 音义。 通过 这 一 半 的 学 习 ， 读 者 将 会 对 Rust 的 所 有 权 
系统 有 全 面 深 入 的 了 解 。 

第 6 章 PRA. ELAIAT CHS 。 在 对 Rust 的 类 型 系统 和 内 存 安全 机 制 
有 J 了 一 定 了 解 之 后 ， 我 们 将 开始 深入 学 习 Rust ”编程 最 党 用 的 语法 结 
构 。 函 数 是 Rust 中 最 利用 的 语法 单元 。Rnust 的 图 数 承 载 了 诸多 函数 式 编 
程 范 取 的 特性 ， 比 如 高 阶 图 数 、 参 数 模 式 匹 配 等 ， 同 时 也 承载 了 面 癌 对 
象 江 式 的 特性 ， 比 如 为 结构 体 及 其 实例 实现 方法 ， 实 际 上 就 古 一 个 函数 
调用 的 语法 糖 。 然 后 将 介绍 团 包 的 用 法 和 特性 ， 帮 助 读者 对 闭 包 建 并 全 
面 深 入 的 认 知 ， 更 重要 的 是 ， 通 过 学 习 闭 包 的 实现 原理 ， 进 一 步 了 解 
Rust 中 零 成 本 抽象 的 哲学 思想 。 最 后 介绍 迭代 需 模 式 ， 以 及 Rust 中 的 友 
as SEAL. tA ASH Rustic h FREE, GI EAN, OR 
KERE SABIE TE o 


第 7 章 结构 化 编程 。 这 一 章 将 对 Rust 混 合 范式 编程 进行 探讨 ， 会 重 
点 介绍 Rust 中 的 结构 体 和 枚 举 体 ， 以 及 它们 如 何在 日 党 编程 中 以 和 面 同 对 
象 风格 编程 。 同 时 ， 还 将 介绍 三 种 设计 模式 ， 前 两 种 是 Rust 标 准 库 以 及 
By ee FA ett eek, Bae PSAN H Rust td E AA N 
计 柑 式 。 通 过 学 习 这 一 章 的 内 容 ， 有 利于 和 营 握 地 道 的 Rust 编 程 风 格 。 

第 8 章 字 符 串 与 集合 类 型 。 字 符 串 是 每 门 编程 语言 最 基本 的 数据 
类 型 ，Rust APA AIS. HP ARBRE BES, Rust HEIERI 
AS#Zh, FABS ARAB WIEM SARS. KRM AS 
HFR, FSEA AA, HRust Ae APA BEE, H 
IA On A CEVA IEMA SS] EAT T, WE rI R ET DE AAS 
Aik. SEAR Wea UD A 7D A AY. IK ER a A 
态 数组 Vector 和 Key-Value 映 射 集 HashMap ”的 使 用 ， 而 且 还 会 深入 挖掘 
HashMap 底层 的 实现 原理 ， 人 介绍 Rust 标准 库 提 供 的 HashMap 安 全 性 ， 
进一步 探讨 如 何 用 Rust 实 现 一 个 生产 级 的 数据 结构 。 最 后 将 通过 探讨 一 
个 Rust 安 全 漏洞 的 成 因 ， 来 帮助 谈 者 正确 理解 容量 的 概念 ， 从 而 写 出 更 
安全 的 代码。 

第 9 E 构建 健壮 的 程序 。 对 于 如 何 构 建 健壮 的 系统 ，Rust 给 出 了 
非常 工程 化 的 解决 方案 。Rust 将 系统 中 的 异常 分 为 了 多 个 层次 ， 分 别 给 
出 了 对 应 的 处 理 手段 。 在 这 一 重 ， 谈 者 将 学 习 Rust 是 如 何以 分 层 的 销 误 
处 理解 雇 方 案 来 帮助 开 及 者 构建 健壮 系统 的 。 

第 10 章 模块 化 编程 。 现 代 编 程 语言 的 一 大 特色 就是 可 以 方便 地 进 
行 模 块 化 ， 这 样 有 利于 系统 的 设计 、 维 护 和 协作 。Rust 在 模块 化 编程 方 
面 做 得 很 好 。 这 一 章 首 先 将 介绍 Rust 强 大 的 包 管 理 系统 Cargo。 然 后 会 
以 真实 的 代码 实 例 阐述 Rust 的 模块 系统 ， 并 且 将 包含 Rust 2018 版 本 中 模 
块 系统 的 重大 改进 。 最 后 将 以 一 个 完整 的 项 目 为 例 曾 述 如 何 使 用 Rust 
开发 日 己 的 crate。 

lle 安全 并 及 。Rust 从 两 方面 文 持 并 及 编程 。 首 先 ， 利 用 类 型 
安全 和 内 存 安 全 的 基础 ， 解 决 了 多 线程 并 发 安全 中 的 痛 点 : 数据 竞争 。 
Rust 8] 以 在 编 详 时 发 现 多 线程 并 友 代 人 码 中 的 安全 问题 。 其 次 ，Rust 为 了 
达成 高 性 能 服务 器 开发 的 目标 ， 开 始 全 面 拥抱 异步 开 肥 。 这 一 章 将 从 线 
程 安全 的 通用 概念 开始 ， 从 Rust 多 线程 并 发 讲 到 异步 并 及 文 择 ， 市 领 谈 
者 逐步 形成 全 面 、 深 入、 通 透 的 理解 。 


第 12 章 元 编程 。 元 编程 即 程 序 生 成 程序 的 能 力 。Rust 为 开发 者 提 
供 了 多 种 元 编程 能 力 。 这 一 章 将 从 反射 开始 介绍 Rust 中 的 元 编程 。 虽 然 
Rust 的 反射 功能 没有 动态 语言 的 那么 踢 大 ， 但 是 Rust 提 供 了 强大 的 宏 系 
统 。 这 一 和 草 将 从 Rust 的 编 详 过 程 出 及 ， 市 领 谈 者 深入 理解 Rust 的 宏 系 统 
的 工作 机 制 ， 并 且 以 共 体 的 实例 帮助 读者 理解 编号 宏 的 技巧 。 从 声明 安 
到 过 程 实 ， 册 到 编译 右手 件 ， 以 及 第 三 方 库 syn 利 guote 最 新 版 的 配合 使 
H, ICES TEAS Bt ETT PAIR 

IZ ERZES -o ATM BT A AS A ce EVE Safe 
Rusth)2eti EW. Wik — BORE Unsafe Rust 的 内 容 来 构建 ， 主 要 
分 为 4 大 部 分 。 首 先 将 介绍 Unsafe Rust 的 基本 语法 和 特性 。 然 后 ， 围 绪 
基于 Unsafe 进 行 安 全 抽象 的 核心 ， 曾 述 Unsafe Rust 开 发 过 程 中 可 能 引起 
未 定义 行为 的 地 方 ， 以 及 相应 的 解决 方案 。 然 后 介绍 FFI， 通 过 具体 的 
实例 来 阐述 Rust 如 何 和 其 他 语言 交互 ,涉及 C、C++、Ruby、Python、 
Node.js 等 语言 ， 还 将 介绍 相关 的 第 三 方 库 。 最 后 ， 将 介绍 未 来 互联 网 的 
核心 技术 WebAssembly， 以 及 Rust 如 何 开 发 WebAssembly 和 相关 的 工 
HE. 

相信 通过 这 13 章 的 内 容 ， 恋 者 将 会 对 Rust 有 人 全面、 深入 和 系统 的 认 


AAW HEAT eA Bug, JERS At ABI Sb. BAe IES 
知识 和 思想 的 途径 ， 更 是 一 种 交流 和 沟通 的 方式 。 如 有 果 你 发 现 本 书 中 的 


任何 销 误 、 址 漏 和 解释 不 清和 攻 的 地 方 ， 欢 迎 提出 反 饥 。 
随 书 源码 地 址 : https: //github.com/ZhangHanDong/tao-of-rust-codes 





勘误 说 明 : 
- 直接 提交 issues。 
` 标明 具体 的 页 码 、 行 数 和 错误 信息 。 


ike Hh Ra aR Fe Rusti] BP o 

更 多 的 学 习 资 源 : 

- 官方 doc.rust-lang.org 列 出 了 很 多 学 习 文 要 和 资源 。 

. 订阅 Rust 每 日 新 闻 内 ， 了 解 Rust 社 区 生态 发 展 ， 学 习 Rust。 

致谢 

首先 ， 我 要 感谢 Rust 社 区 中 每 一 位 帮助 过 我 的 朋友 ， 没 有 你 们 的 奉 
AK, MAXA P. 

感谢 Mijike 组 织 社 区 编写 的 免费 书籍 Rust Primer 。 感 谢 Rust 社 区 中 不 
知名 的 翻译 者 翻译 官方 的 Rust Book . IWE (Rustante) BIEVER F 
苦 的 写作 。 感 谢 KiChjang、ELTON、CrLF0710、F001、Lingo、 
tennix、iovxw、wayslog、Xidorm、42、 黑 上 腹 唤 等 其 他 社区 里 的 朋友 们 ， 
你 们 在 我 学 习 的 过 程 中 给 予 了 我 无 私 的 帮助 和 解答 ，Rust 社 区 有 你 们 真 
好 。 感 谢 知 道 我 写作 并 一 二 或 励 和 文 持 我 的 朋友 们 。 袁 心 希 望 Rust 和 社区 
可 以 一 直 这 么 强大 、 瘟 柔和 友好 。 

然后 ， 我 要 感谢 电子 工业 出 版 社 的 刘 因 囊 编 和 加。 感谢 你 给 了 我 这 个 
机 会 ， 让 这 本 书 从 想法 成 为 了 现实 。 

Bn, RUIN PORK, ADVI. ARES BA. EM 
sce, A LER Ree ASE AS a OARA CENE. PRUNE SC 
母 ， 正 是 他 们 的 培养 ， 才 使 我 具有 积极 、 坚 持 不 懈 做 事情 的 品格 。 

读者 服务 

轻松 注册 成 为 博文 视点 社区 用 户 (www.broadview.com.cn) , 48 
直达 本 书页 面 。 

下载 资源 : 本 书 如 提供 示例 代码 及 资源 文件 ， 均 可 在 下 载 资源 
处 下 载 。 

` 提交 勘误 : 您 对 书 中 内 容 的 修改 意见 可 在 提交 勘误 处 提交 ， 厂 
锌 采纳， 将 获 赠 博文 视点 社区 积分 (在 您 购买 电子 书 时 ， 积 分 可 用 来 抵 
扣 相 应 金额 ) 。 

“ 交流 互动 : 在 页 面 下 方 REWE 处 留 下 您 的 疑问 或 观点 ， 与 我 
们 和 其 他 读者 一 同学 习 交 流 。 

页 面 入 口 : http: //www.broadview.com.cn/35485 





[1] https://github.com/RustStudy/rust_daily_news 
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第 1 草 新 时 代 的 语言 


MREMA, MERSE. 

MEER LS BCE A ZS ET Be, MEAS AI RE nA II 
问题 ， 如 何 才 能 知 庆 宇宙 万 物 星罗棋布 的 规律 ? PEER TA be H 
完 ， 了 驶 是 为 了 探 如 这 个 秘密 。 如 末 科 学 家 们 能 和 宇宙 的 设计 痢 对 话 ， 束 
可 以 通过 设计 者 的 杀 口 描述 了 解 其 对 宇宙 万 物 的 规划 ， 这 样 束 可 以 对 研 
完 衬 宙 万 物 起 到 提纲 草 领 的 作用 ， 科 学 家 们 的 工作 会 更 有 成 效 。 但 是 ， 
没有 这 种 “如 未 ”。 

一 门 编程 语言 束 像 一 个 小 宇 害 ， 语 言 中 的 各 种 语法 概念 就 像 一 颖 颗 
星辰 。 对 于 初学 者 来 说 ， 看 这 些 语 法 概念 与 看 星罗棋布 时 产生 的 迷惑 是 
相似 的 。 幸 亏 编 程 语言 是 由 人 类 创造 的 ， 编 程 语 言 的 作者 可 以 被 找到 ， 
编程 语言 的 源码 也 可 以 被 看 到 ， 其 至 一 些 好 的 编程 语言 还 会 为 你 准备 好 
非常 丰富 的 文档 ， 供 你 参阅 学 习 。 通 过 这 些 信 息 我 们 可 以 了 解 到 : 一 门 
语言 缘何 诞生 ? 它 想 解决 什么 问题 ? 它 遵 循 什么 样 的 设计 斩 学 ? 一 门 好 
的 语言 是 有 内 涵 哲 学 的 语言 ， 它 表里如一 ， 有 所 想 ， 有 所 为 。 

Rust 语言 束 是 这 样 一 门 否 学 内 遂 丰 宇 的 编程 语言 。 通 过 了 解 Rust 
遵循 什么 样 的 设计 斩 学 ， 进 一 步 了 解 它 的 语法 结构 和 编程 理念 ， 束 可 以 
系统 地 掌握 这 门 语言 的 核心 ， 而 不 至 于 在 其 纷 蛇 复杂 的 语法 细节 中 迷 
失 。 


1.1 缘起 


任何 一 门 新 技术 的 兴起 ， 都 是 为 了 解决 一 个 问题 。 

上 自 操 作 系 统 诞 后 以 来 ， 系 统 级 主流 编程 语言 ， 从 汇编 语言 到 C++, 
OARE ik 50 个 年 头 ， 但 依然 存在 两 个 难题 ; 

: 很 难 编写 内 存 安全 的 代码 。 

很 难 编写 线程 安全 的 代码 。 

这 两 个 难题 存在 的 本 质 原 因 是 C/C++ 属于 类 型 不 安全 的 语言 ， 它 们 
溥 弱 的 内 存 管 理 机 制导 致 了 很 多 种 见 的 漏 铜 。 其 实 20 世 纪 80 年 代 也 出 现 
过 非常 优秀 的 语言 ， 比 如 Ada 语 言 。Ada 拥 有 诸多 优秀 的 特性 ， 可 以 在 
编 详 期 进行 类 型 检 否 、 无 GC 陈 确定 性 内 存 管 理 、 内 置 安全 并 友和 模型 、 
无 数据 竞争 、 系 统 级 人 硬 实时 编程 等 。 但 它 的 性 能 和 同时 期 的 C/C++ 相 比 
确实 是 有 大 距 的 。 那 个 时 代 计 算 资 源 匮乏 ， 大 家 人 退 求 的 是 性 能 。 所 以 ， 
大 家 都 守 愿 牺牲 安全 性 来 换取 性 能 。 这 也 是 C/C++ 得 以 普及 的 原因 。 

时 间 很 快 到 了 2006 年 ， 上 自称 “职业 编程 语言 工程 师 ” 的 Graydon 
Hoare 〈 简 称 为 GH) ， 开 始 开 发 一 门 名 为 Rust 的 编程 语言 。 

什么 是 “职业 编程 语言 工程 师 ”? 用 GH 目 己 的 话说 ， 职 业 编 程 语言 
工程 师 的 日 闸 工 作 就 是 给 其 他 语言 开发 编译 上 融和 工具 集 ， 但 并 未 参与 这 
些 语言 本 身 的 设计 。 自 然而 然 地 ，GH 萌 生 了 自己 开发 一 门 语言 的 想 
法 ， 这 门 语言 就 是 Rust 。 

“Rust” 这 个 名 字 包 含 了 GH 对 这 门 语 言 的 预期 。 在 自然 界 有 一 种 叫 作 
oF Ll (Rust Fungi) HEAK, XMR ar AE TEL, 引发 病害 ， 而 且 
号 称 “ 本 世纪 最 可 怕 的 生态 病害 ”之 一 。 这 种 真菌 的 生命 力 非 常 闫 强 ， 其 
在 生命 周期 内 可 以 产生 多 达 5 种 孢子 类 型 ， 这 5 种 生命 形态 还 可 以 相互 转 
化 ， 如 果 用 软件 术语 来 描述 这 种 特性 ， 那 就 是 “和 鲁 棱 性 超 强 ”?”。 可 以 回想 
一 下 Rust 的 Logo 形 状 〈 如 图 1-1 所 示 ) ， 像 不 像 一 个 细 落 ? Logo 上 面 有 5 
个 圆圈 ， 也 和 和 锈 阔 这 5 种 生命 形态 相对 应 ， 上 暗示 了 Rust 语 言 的 鲁 棱 性 也 
超 强 。“Rust” 也 有 “铁锈 ”的 量 思 ， 暗 合 “ 裸 金属 ”之 是， 代表 了 Rust 刚 系 
统 级 编程 语言 属性 ， 有 直接 操作 底层 硬件 的 能 力 。 此 外 ，“Rnust" 在 字形 
SHA ETE T “Trust” M “Robust”, Haas J “ABE? BB Pepe”. 


此 , “Rus HA-DA. FKH, Rusti MME 4 FI 
UF 





41-1: Rust 语 言 的 Logo 
GH 认 为 ， 未 来 的 互联 网 除了 关注 性 能 ， 还 一 定 会 高 度 天 注 安全 性 
和 并 及 性 。 整 个 世界 对 C 和 C++ 的 设计 方式 的 育 睐 在 不 断 地 有 发生 改 变 。 
其 实 20 世 纪 七 八 十 年 代 涌现 了 很 多 优秀 的 语言 ， 拥 有 很 多 优秀 的 特性 ， 
但 它们 的 内 存 模型 非常 简易 ， 不 能 保证 足够 的 安全 。 比 如 Ada 语 言 的 动 
态 内 存 管 理 虽 然 是 高 规格 的 安全 设计 ， 但 还 是 引起 了 非 铝 重大 的 安全 事 
fm UL, 


ATLA, GHA) JiS S EE aT FP 
必须 是 更 加 安全 、 不 易 骨 演 的 ， 尤 其 在 操作 内 和 存 时 ， 这 一 后 更 为 


:不 需要 有 垃圾 回收 这 样 的 系统 ， 不 能 为 了 内 存 安 全 而 引入 性 能 负 
担 。 

”不 是 一 门 仅 仅 拥有 一 个 主要 特性 的 语言 ， 而 应 该 拥有 一 系列 的 广 
泛 特 性 ， 这 些 特 性 之 间 又 不 乏 一 致 性 。 这 些 特 性 可 以 很 好 地 相互 协作 ， 
从 而 使 该 语言 更 容易 编号、 维护 和 调试 ， 让 程序 员 写 出 更 安全 、 更 高 效 
的 代码 。 

总 而 言 之 ， 承 是 可 以 提供 高 的 开发 效率 ， 人 代码 容易 维护 ， 性 能 还 能 
与 C/C++ 媲美 ， 还 得 保证 安全 性 的 一 门 语言 。 正 是 因为 GH 以 这 种 观点 作 
为 基石 ， 才 使 得 今天 的 Rust 成 为 了 一 门 同时 追求 安全 、 并 发 和 性 能 的 
现代 系统 级 编程 语言 。 

GH 确实 找 对 了 本 质问 题 一 一 互联 网 发 展 至 今 ， 性 能 问题 已 经 不 再 
是 其 友 展 瓶 贷 ， 安 全 问题 才 是 阻碍 其 发 展 的 “重奖 *"。 但 和 分 什么 说 Rust 整 
能 解决 这 个 问题 呢 ? 





l2 kir 


为 了 达成 目标 ，Rust 语 言 遵循 了 三 条 设计 哲学 : 

-内存 安全 

» 2S MAS HH RR 

` 实用 性 

也 束 是 说 ，Rnust 语 言 中 所 有 语法 特性 都 围 经 这 三 条 哲学 而 设计 ， 这 
也 是 Rust 语 言 一 致 性 的 基础 。 


1.2.1 内 存 安 全 


安全 是 Rust 要 保证 的 重 中 之 重 。 如 果 不 能 保证 安全 ， 那 么 Rust 残 没 
有 存在 的 意义 。Rust 语 言 如 何 设计 才能 保证 安全 呢 ? 

现代 编程 语言 早已 发 展 到 了 “程序 即 类 型 证 明 ” 的 阶段 ， 类 型 系统 基 
本 已 经 成 为 了 各 大 编程 语言 的 标 配 ， 尤 其 是 近 几 年 新 出 现 的 编程 语言 。 
类 型 系统 提供 了 以 下 好 处 : 

允许 编译 占 佐 测 无 意义 其 至 无 效 的 代码 ， 雄 圳 程序 中 隐 仿 的 错 
Re 

AU Aa Pease Ae RAY, FPR TS. 

AP DAS SE RAS A ee, BEE ASIA Ae ek A 

. 提供 了 一 定 程 度 的 高 级 抽象 ， 提 升 开 友 效 率 。 

一 般 来 说 ， 一 门 语 言 只 要 保证 类 型 安全 ， 了 驶 可 以 说 它 是 一 门 安 全 的 
语言 。 人 简单 来 说 ， 闫 型 安全 是 指 类 型 系统 可 以 保证 程序 的 行为 是 巧 义 明 
确 、 不 出 错 的 。 像 C/C++ 语言 的 类 型 系统 就 不 是 类 型 安全 有 的， 因为 它们 
并 没有 对 无 音义 的 行为 进行 约束 。 一 个 最 简 早 的 例子 就 是 数组 越界 ， 在 
C/C++ 语言 中 并 不 对 其 做 任何 检查 ， 导 致 改 生 了 语言 规 沁 规定 之 外 的 行 
为 ， 也 就 是 未 定义 行为 (Undefined Behavior ) 。 而 这 些 未 定义 行为 恰 
恰 是 漏洞 的 温床 。 所 以 ， 像 C/C++ 这 种 语言 就 是 类 型 不 安全 的 语言 。 

Rust 语 言 如 果 想 你 证 内 存 安全 ， 站 先 要 做 的 就 是 保证 类 型 安全 。 

在 诸多 编程 语言 中 ，OCaml 和 Haskell 是 公认 的 类 型 安全 的 典范 ， 


它们 的 类 型 系统 不 仅仅 有 强大 的 类 型 论 理论 “背书 ”， 而 且 在 实践 生产 环 
境 中 也 久 经 考验 。 所 以 ，Rust 语言 借鉴 了 它们 的 类 型 系统 来 保证 类 型 安 
全 ， 尤 其 是 Haskell， 你 能 在 Rust 语 言 中 看 到 更 多 Haskell 类 型 系统 的 影 

然而 ， 直 接 使 用 Haskell 的 类 型 系统 也 无 法 解决 内 存 安全 问题 。 类 
型 系统 的 作用 是 定义 编程 语言 中 值 和 表达 式 的 类 型 ， 将 它们 归 类 ， 赋 了 予 
它们 不 同 的 行为 ， 指 导 它 们 如 何 相互 作用 。Haskell 是 一 门 纯 函数 式 编程 
语言 ， 它 的 类 型 系统 主要 用 于 承载 其 “ 纯 函 数 式 ”的 思想 ， 是 范畴 论 的 体 
现 。 而 对 于 Rust 来 说 ， 它 的 类 型 系统 要 承载 其 “内 存 安全 ”的 思想 。 所 
以 ， 还 需要 有 一 个 安全 内 存 管理 模型 ， 并 通过 类 型 系统 表达 出 来 ， 才 能 
保证 内 存 安全 。 

那么 ， 什 么 是 内 存 安 全 呢 ? 简单 来 说 ， 吏 是 不 会 出 现 内 存 访问 错 
WR o 

只 有 当 程 序 访问 未 定义 内 存 的 时 候 才 会 产生 内 存 错误 。 一 般 来 说 ， 
发 生 以 下 几 种 情况 就 会 产生 内 存 错 误 : 

oe 

:使 用 未 初始 化 内 存 。 

释放 后 使 用 ， 也 就 是 使 用 悬垂 指针 。 

缓冲 区 溢出 ， 比 如 数组 越界 。 

非法 释放 已 经 释放 过 的 指针 或 未 分 配 的 指针 ， 也 就 是 重复 释放 。 

这 些 情 况 之 所 以 会 产生 内 存 错误 ， 是 因为 它们 都 访问 了 未 定义 内 
存 。 为 了 保证 内 存 安全 ，Rust 语 言 建 立 了 严格 的 安全 内 存 管理 模型 : 

PRAMAS 。 每 个 被 分 配 的 内 存 都 有 一 个 独占 其 所 有 权 的 指针 。 
只 有 当 该 指针 被 销毁 时 ， 其 对 应 的 内 存 才能 随 之 被 释放 。 

”借用 和 生命 周期 。 每 个 变量 都 有 其 生命 周期 ， 一 旦 超出 生命 周 
期 ， 变 量 束 会 被 日 动 释放 。 如 果 是 们 用 ， 则 可 以 通过 标记 生命 周期 参数 
供 编译 器 检查 的 方式 ， 防 止 出 现 悬 垂 指 针 ， 也 就 是 释放 后 使 用 的 情况 。 

其 中 所 有 权 系 统 还 包括 了 从 现代 C++ 那里 借鉴 的 RAI 机 制 ， 这 是 
Rust 盛 GC 但 是 可 以 安全 定理 内 存 的 基石 。 

建立 了 安全 内 存 管理 模型 之 后 ， 再 用 类 型 系统 表达 出 来 即 可 。Rust 


从 Haskell 的 类 型 系统 那里 借鉴 了 以 下 特性 : 

-ATIRE 

-AUAA 

` a RY PRIA 

代数 数据 类 型 

模式 下 配 

ral 

trait 和 关联 类 型 

` 本 地 类 型 推导 

为 了 实现 内 存 安 全 ，Rust 还 具备 以 下 独 有 的 特性 : 

- WRA (Affine Type) , ZKH AKA Rust hh A MF Move 
语义 。 

信用、 生命 周期 。 

借助 其 型 系统 的 强大 ，Rnust 编 译 右 可 以 在 编 诺 期 对 类 型 进行 检 答 ， 
看 其 是 个 满 足 安 全 内 存 模型 ， 在 编 详 期 束 能 发 现 内 存 不 安全 问题 ， 有 效 
地 阻止 未 定义 行为 的 发 生 。 

内 存 安 全 的 Bug 和 并 有 发 安全 的 Bug 产 生 的 内 在 原因 是 相同 的 ， 都 是 
因为 内 存 的 不 正当 访问 而 造成 的 。 同 样 ， 利 用 装载 了 所 有 权 的 强大 类 型 
系统 ，Rust 还 解雇 了 并 发 安全 的 问题 。Rust 编 详 需 会 通过 静态 检查 分 
析 ， 在 编译 期 吏 检 查 出 多 线程 并 发 代码 中 所 有 的 数据 竞争 问题 。 


1.2.2 零 成 本 抽象 


除了 安全 性 ，Rust 还 追求 高 效 开 发 和 性 能 。 

编程 语言 如 果 想 做 a 到 局 效 开 发 ， 束 必须 拥有 一 定 的 抽象 表达 能 
关于 抽象 表达 能 力 ， 最 具 代 表 性 的 语言 就 是 Ruby。Ruby 代 人 码 和 Rust 代 码 
的 对 比 示 意 如 代码 清单 1-1 所 示 。 

代码 清单 1-1，Ruby 代 码 和 Rust 代 码 对 比 示意 


1. # Ruby RÆ 
s ovtimes{ puts "Hello Ruby"™} 


3. ardaya. Irom now 

4. // Rust 代码 

3 oseames(|| peantin! ("dello Rust”) )s 
6. 24,days().«from now(); 


在 代码 清单 1-1 中 ， 人 代码 第 2 行 和 第 3 行 是 Ruby 人 代码， 分 别 表 示 “ 输 出 
5 次 " Hello Ruby" ”和 “从 现在 开始 两 天 之 后 ”， 代 人 码 的 抽象 表达 能 力 已 
经 非常 接近 自然 语言 。 再 看 第 5 行 和 第 6 行 的 Rust 代 码 ， 它 和 Ruby 语 言 的 
抽象 表达 能 力 是 不 相 上 下 的 。 

但 是 Ruby 的 抽象 表达 能 力 完 全 是 徘 牺 牲 性 能 换 来 的 。 而 Rust 的 抽象 
是 零 成 本 的 ，Rust 的 抽象 并 不 会 存在 运行 时 性 能 开销 ， 这 一 切 都 是 在 编 
详 期 完成 的 。 人 代码 清单 1-1 PAR 5 次 的 抽象 代码 ， 在 编译 期 会 被 展 
开 成 和 手 与 汇编 代 介 相近 的 故 层 代码 ， 所 以 不 存在 运行 时 因为 解释 这 一 
层 抽 和 象 而 产生 的 性 能 开销 。 对 于 一 门 系统 级 编程 语言 而 言 ， 运 行 时 零 成 
本 是 非常 重要 的 。 这 一 点 ，Rust 做 到 了 。 

Rust 中 零 成 本 抽象 的 基石 承 是 汉 型 和 trait， 在 后 面 的 章节 中 会 逐步 
TR ZR LH “JB” 


1.2.3 实用 性 


如 何 评价 一 门 编程 语言 的 实用 性 ?事实 上 并 没有 统一 的 说 法 ， 但 可 
以 从 以 下 三 个 方面 进行 评判 |: 

` 实践 性 ， 首 先 必 须 能 够 应 用 于 开发 工业 级 产品 ， 其 次 要 易于 学 习 
和 使 用 。 

.有益 性 ， 是 指 能 够 对 业界 产生 积极 的 效果 或 影响 。 

. 稳定 性 ， 是 指 语言 自身 要 稳定 。 在 解决 同一 个 问题 时 ， 不 会 因为 
使 用 者 不 同 而 出 现 随机 的 结果 。 

那么 Rust 语 言 在 这 三 个 方面 的 表现 如 何 呢 ? 

实践 性 

Rust 己 经 为 开发 工业 级 产品 做 足 了 准备 。 


为 了 你 证 安全 性 ，Rust 引 入 了 强大 的 类 型 系统 和 所 有 权 系 统 ， 不 仪 
保证 内 存 安 全 ， 还 你 证 了 并 发 安全 ， 同 时 还 不 会 牺牲 性 能 。 

为 了 保证 支持 人 硬 实时 系统 ，Rust 从 C++ 那 里 借鉴 了 确定 性 析 构 、 
RAII 和 智能 指针 ， 用 于 自动 化 地 、 确 定性 地 管理 内 存 ， 从 而 避免 了 GC 
的 引入 ， 因 而 就 不 会 有 “世界 交集 ”的 问题 了。 这 几 项 虽然 借鉴 目 C++， 
但 是 使 用 起 来 比 C++ 更 加 人 简洁 。 

为 了 保证 程序 的 健壮 性 ，Rust 重 新 审视 了 错误 处 理 机 制 。 日 钊 开发 
中 一 般 有 三 次 非 正 彰 情 况 : 失败 、 错 误 和 异常 。 但 是 像 C 语 言 这 种 面 问 
过 程 的 语言 ， 开 发 者 只 能 通过 人 返回 值 、goto 等 语句 进行 错误 处 理 ， 并 日 
没有 统一 的 错误 处 理 机 制 。 而 C++ 和 Java 这 种 高 级 语言 虽然 引入 了 有 异 禹 
处 理 机 制 ， 但 没有 专门 提供 能 够 有 效 区 分 正常 地 辑 和 错误 人 好 辑 的 语法 ， 
而 只 是 统一 全 局 进行 处 理 ， 导 致 开发 者 只 能 将 所 有 的 非 正 利 情 况 都 当 作 
寞 党 去 处 理 ， 这 样 不 利于 健壮 系统 的 开发 。 并 且 寞 遇 处 理 还 会 带 来 比较 
大 的 性 能 开销 。 

Rust 语 言 针对 这 三 类 非 正 第 情况 分 别提 供 了 专门 的 处 理 方 式 ， 让 开 
发 者 可 以 分 情况 去 选择 。 

` 对 于 失败 的 情况 ， 可 以 使 用 断言 工具 。 

对 于 错误 ，Rust 提 供 了 基于 返回 值 的 分 层 错 误 处 理 方式 ， 比 如 
Option 达 TT 二 可 以 用 来 处 理 可 能 存在 空 值 的 情况 ， 而 Rest<T> WEI] 
用 来 处 理 可 以 被 合理 解决 并 需要 传播 的 错误 。 

”对 于 异常 ，Rust 将 其 看 作 无 法 被 合理 解决 的 问题 ， 提 供 了 线程 恐 
刁 机 制 ， 在 发 生 异 第 的 时 候 ， 线 程 可 以 安全 地 退出 。 

通过 这 样 精致 的 设计 ， 开 用 者 融 可 以 从 更 细 的 粒度 上 对 非 正 第 情况 
进行 合理 处 理 ， 了 最 终 编 与 出 更 加 健壮 的 系统 。 

为 了 和 现 有 的 生态 系统 民 好 地 集成 ，Rust 支持 非常 方便 且 零 成 本 的 
FFI 机 制 ， 兼 容 C-ABI， 并 且 从 语言 染 构 层面 上 将 Rust 语 言 分 成 Safe Rust 
和 Unsafe Rust 两 部 分 。 其 中 Unsafe Rust 专 门 和 外 部 系统 打交道 ， 比 如 操 
作 系 统 内 核 。 之 所 以 这 样 划 分 ， 是 因为 Rust 编 译 鼎 的 检查 和 跟踪 是 有 能 
力 范 围 的 ， 它 不 可 能 检查 到 外 部 其 他 语言 接口 的 安全 状 在 ， 所 以 只 能 车 
开发 者 自己 来 保证 安全 。Unsafe Rust 提 供 了 unsafe 关 键 字 和 unsafe 块 ， 显 
式 地 将 安全 代码 和 访问 外 部 接口 的 不 安全 代码 进行 了 区 分 ， 也 为 开发 者 


调试 错误 提供 了 方便 。Safe Ruta FRAKASE tE aS Be i TE ing PEI 
保证 安全 ， 而 Unsafe Rust 表 示 让 编 详 项 信任 开发 者 有 能 力 保 证 安全 。 

有 人 的 地 方丈 有 Bug。Rust 语 言 通过 精致 的 设计 ， 将 机 琵 可 以 检 和 在 
控制 的 部 分 都 交 给 编译 卓 来 执行 ， 而 将 机 器 无 法 控制 的 部 分 交 给 开发 者 
目 己 来 执行 。Safe Rust 保 证 的 是 编译 占 在 编译 时 最 大 化 地 保障 内 存 安 
全 ，| 咀 止 未 定义 行为 的 发 生 。Unsafe Rust 用 来 提醒 开发 者 ， 此 时 开发 的 
代码 有 可 能 引起 未 定义 行为 ， 请 齐 惯 ! 人 和 编译 右 共享 同一 个 “安全 标 
型 *»， 相 互信 任 ， 彼 此 和 和谐， 以 此 来 好 大 化 地 消除 人 产生 Bug 的 可 能 。 

为 了 让 开发 者 更 方便 地 相互 协作 ，Rust 提 供 了 非常 好 用 的 包 管 理 桥 
Cargo。Rust 代 码 是 以 包 〈crate) 为 编译 和 分 发 单位 的 ，Cargo 提 供 了 很 
多 人 命令， 方便 开发 者 创建 、 构 建 、 分 有 发、 管理 目 己 的 包 。Cargo 也 提供 
插件 机 制 ， 方 便 开 发 者 编 与 目 定 义 的 插件 ， 来 满足 更 多 的 需求 。 比 如 官 
方 提供 的 rustfmt 和 clippy 工 具 ， 分 别 可 以 用 于 目 动 格式 化 代码 和 发 现代 
体 中 的 “ 坏 味 道 ?>。 再 比如 ，rustfix 工 具 甚 至 可 以 帮助 开发 者 根据 编 诺 项 
的 建议 自动 修复 出 错 的 代码 。Cargo 还 天 生 拥 抱 开 源 社区 和 Git， 支 持 将 
写 好 的 包 一 键 发 布 到 crates.io 网 站 ， 供 其 他 人 使 用 。 

为 了 方便 开发 者 学 习 Rust，Rust 官 方 团队 做 出 了 如 下 努力 : 


. 独立 出 专门 的 社区 工作 组 ， 编 写 官方 Rust Bookl 人 4 ， 以 及 其 他 各 种 
不 同 深 度 的 文档 ， 比 如 编译 器 文档 、nomicon book 等 。 其 至 组 织 人 免费 的 
社区 教学 活动 Rust Bridge, AERIAL KTR STE, SH. 

”Rnust 语 言 的 文档 文 择 MarkDown 格 式 ， 因 此 Rust 标 准 库 文档 表现 力 
丰 刘 。 生 态 系 统 内 很 多 第 三 方 包 的 文档 的 表现 力也 同样 得 以 提升 。 

: 提供 了 非常 好 用 的 在 线 Playground 工 具 ， 供 开发 者 学 习 、 使 用 和 分 
TA 

Rust 语 言 很 早 束 实现 了 目 淮 ， 方 便 学 习 者 通过 阅读 源码 了 解 其 内 
部 机 制 ， 甚 至 参与 页 献 。 

- Rust 核心 团队 一 直 在 不 断 改 进 Rust， 致 力 于 提升 Rust WARE, 
极力 降低 初学 者 的 心智 负担 ， 减 组 学 习 曲 线 。 比 如 引入 NLL 特性 来 改 
进 们 用 检 栓 系统 ， 使 得 开 用 者 可 以 编 与 更 加 符合 直觉 的 代 但 。 

虽然 从 Haskell 那 里 信 黎 了 很 多 类 型 系统 相关 的 内 容 ， 但 是 Rust 团 
队 在 设计 和 宣传 语言 特性 的 时 候 ， 会 特意 地 去 学 术 化 ， 让 Rust 的 概念 更 


加 亲民 。 

:在 类 型 系统 基础 上 提供 了 泥 合 编程 范 式 的 文 持 ， 所 供 了 强大 而 倍 
洁 的 抽象 表达 能 力 ， 极 大 地 提升 了 开发 者 的 开发 效率 。 

:提供 更 加 严格 且 智 能 的 编译 占 。 基 于 类 型 系统 ， 编 译 占 可 以 严格 
地 检查 代码 中 隐 着 的 问题 。Rust 官 方 团队 还 在 不 断 优 化 编译 右 的 诊断 信 
居 ， 使 得 开发 者 可 以 更 加 轻松 地 定位 错误 ， 并 快速 理解 错误 发 生 的 原 
A] 。 

里 然 Rust 官 方 团队 做 了 以 上 诸多 努力 ， 但 是 目前 还 有 一 大 部 分 开发 
者 认为 Rust 语 言 学 习 曲 线 鼎 陡 。 其 中 最 为 话 病 的 束 是 Rust 目 前 的 借用 检 
全 系统 。 这 其 实 是 因为 Rust 语 言 的 设计 融合 了 诸多 语言 的 特点 ， 而 当今 
大 部 分 开发 者 只 是 擅长 其 中 一 门 语言 ， 对 其 他 语言 的 特性 不 太 了 解 。C 
语言 的 开发 者 虽然 对 的 层 内 存 官 理 比较 熟悉 ， 但 是 末 必 熟悉 C++ 的 RAII 
机 制 ; 即使 熟悉 C++， 也 未 必 熟 悉 Haskell 的 类 型 系统 ， 即 便 熟 悉 Haskell 
的 类 型 系统 ， 也 未 必 懂 得 撒 层 内 存 党 理 机 制 。 更 不 用 说 内 置 GC 的 Java、 
Ruby、Python 等 面 癌 对 象 语言 的 开 及 者 了 。 

要 解决 这 个 问题 ， 可 以 从 以 下 几 点 出 发 来 学 习 Rust: 

“ 保持 初学 者 心态 。 当 和 面 对 Rust 中 难以 理解 的 概念 时 ， 先 不 要 急于 
把 其 他 语言 的 经 验 套 用 其 上 ， 而 应 该 从 Rust 的 设计 哲学 出 发 ， 去 理解 如 
此 设计 Rust 的 语言 特性 的 原因 ， 寻 找 其 内 在 的 一 致 性 。 

乞 学 习 概 念 再 动手 实践 ”。 很 多 传统 语言 开 用 者 在 和 学习 Rust 的 时 
候 ， 一 上 来 承 开 始 动手 与 代 但 ， 结 果 却 栽 了 跟头 ， 连 编译 都 无 法 通过 。 
看 似 符 合 直 入 的 代码 ， 却 因为 借用 检查 而 导致 编译 失 败 。 这 是 因为 Rust 
Sy Eas TE VRS RES PACH Se, TREN ARS oe. ALA, FE 
实 不 是 Rust 学 习 曲 线 了 尘 ， 而 是 直接 动手 写 代 人 码 的 学 习 方 法 有 问题 。 

. 把 编译 器 当 作 朋友 。 不 要 忽略 Rust 编 译 器 的 诊断 信息 ， 大 多 数 情 
况 下 ， 这 些 诊断 信息 里 已 经 把 错误 原因 前 述 得 非常 明确 。 这 些 诊断 信息 
可 以 帮助 你 学 习 Rust， 纠 正 上 自己 的 钳 误 认 知 。 

俗话 说 得 好 ， 逆 境 也 是 机 遇 。 正 是 因为 Rust 有 这 些 特 点 ， 学 习 Rust 
的 过 程 也 是 一 次 目 我 提升 的 过 程 ， 能 够 帮助 你 成 为 更 好 的 程序 员 。 

有 益 性 和 稳定 性 

Rust 语 言 解决 了 内 存 安全 和 并 发 安全 的 问题 ， 可 以 极 大 地 提升 软件 
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统 、 操 作 系 统 、 网 络 服务 等 展 层 系统 ， 但 它 并 不 局 限于 此 ， 筷 还 可 以 用 
于 开 及 上 层 Web 应 用 、 州 戏 引 擎 和 机 需 学 习 ， 甚 至 基于 WebAssembly 拉 
ANI AY DASE AC HI mA. AL as I EE NS C/C++ A PEE, Rust 
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看 得 出 来 ，Rust 的 诞生 给 业界 市 来 了 非常 积极 的 影响 。Rust 语 言 目 
从 及 布 了 1.0 厂 以 来 已 经 进入 了 稳定 期 。 虽 然 还 在 不 断 地 改进 和 发 布 新 
的 特性 ， 但 是 Rust 的 核心 是 不 变 的 。 

综 上 上 所 述 ，Rust 在 实践 性 、 有 益 性 和 稳定 性 三 方面 都 做 到 位 了 ， 
Rnust 的 实用 性 毋庸 置疑 。 


1.3 现状 与 未 来 


从 2015 年 Rust 发 布 1.0 版 本 以 来 ，Rust 语 言 已 经 被 广泛 应 用 于 各 大 公 
司 及 诺 多 领域 。 每 一 年 ，Rust 社 区 都 会 聚集 在 一 起 制订 路 线 图 ， 规 划 
Rust 未 来 的 发 展 。 在 2018 年 ，Rust 团 队 推 出 了 新 的 大 版 本 Cedition) 计 
Xl 

`- Rust 2015 版 本 , Rust 1.0 一 1.30 语 义 化 版 本 。 目 标 是 让 Rust 更 
加 稳定 。 

- Rust 2018 版 本 , Rust 1.31 将 是 Rust 2018 版 本 的 首 个 语义 版 本 。 目 
标 是 让 Rust 进 一 步 走 问 生 产 级 。 

这 个 大 版 本 和 语义 化 版 本 是 正 交 的 。 大 版 本 的 意义 在 于 方便 Rust 目 
刁 的 进化 。 例 如 ， 想 在 Rust 中 引入 新 的 关键 字 try， 但 是 如 果 只 有 语义 
化 版 本 这 一 个 维度 ， 新 的 关键 字 可 能 会 破坏 现 有 的 Rust 生 态 系 统 。 所 
以 ， 就 需要 引入 一 个 大 版 本 ， 在 Rust 2018 版 本 中 引入 try 关 键 字 。 开 发 者 
选择 “edition=2018”， 束 代表 了 开发 者 接受 Rust 的 这 种 内 部 变化 ， 接 受 
新 的 关键 字 try。 大 版本 升级 的 只 是 表面 的 语法 功能 ，Rust 的 核心 概念 是 
不 会 改变 的 。 

Rust 的 编译 需 可 以 方便 地 管理 版 本 的 兼容 性 : 

- Rust 2015 和 Rust 2018 是 彼此 兼容 的 。 

Rnust 编 译 硕 知道 如 何 编译 这 两 个 版 本 ， 恕 像 javac 知 道 如 何 编译 
Java 9 和 Java 10、gcc 和 clang 知 午 如 何 处 理 C++14 和 C++17 一 样 。 

可 以 在 Rust 2018 版 本 中 依赖 Rust 201SH Fe, BZIP. 

- Rust 2015 版 本 并 未 冻结 。 

此 外 ， 大 版 本 可 能 是 每 三 年 发 布 一 次 ， 那 么 下 一 次 发 布 就 是 在 2021 
年。 不 过 Rust 团 队 对 此 还 保留 修改 权 。 


1.3.1 语言 架构 


为 了 便于 学 习 ， 笔 者 针对 Rust 语 言 概念 的 层次 结构 进行 了 柄 理 ， 如 
图 1-2 所 示 。 
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图 1-2: Rust 中 概念 层次 结构 梳理 

图 1-2 将 Rust 语 言 中 的 概念 分 成 了 4 个 层次 。 

最 底层 是 安全 内 存 管理 层 ， 该 层 主 要 是 涉及 内 存 管理 相关 的 概念 。 

倒数 第 二 层 是 类 型 系统 层 ， 该 层 起 到 承 上 局 下 的 作用 。 类 型 系统 层 
aX SEEN AM ASE XARA Steve sk, WAP sf Rust SA 
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内 存 分 配 等 操作 的 控制 能 

对 于 开发 者 而 吝 ， 只 需要 掌握 类 型 系统 、 所 有 权 系 统 和 混合 式 编程 
沁 式 即 可 ， 不 需要 操心 确 层 的 内 存 是 任 安 全 ， 因 为 有 编 详 融和 和 类 型 系统 
帮忙 处 理 。 在 这 个 语言 染 构 之 下 ， 人 和 编译 右 共用 同一 僚 “ 心 吞 模 型 ”， 
这 样 可 以 极 大 地 保证 系统 的 安全 和 健壮 性 。 

在 后 续 的 章节 中 ， 会 依照 该 语言 架构 对 Rust 语 言 自 底 向 上 进行 分 层 
探索 ， 以 帮助 读者 对 Rust 语 言 的 概念 融会 贯通 。 


1.3.2 开源 社区 


Rust 语 言 自 壬 作为 一 个 开源 项 目 ， 也 是 现代 开源 软件 中 的 一 条 玲 下 
的 明珠 。 

在 Rust 之 前 诞生 的 所 有 语言 ， 都 仅仅 用 于 商用 开发 ， 但 是 Rust 语 言 
改变 了 这 一 状况 。 对 于 Rust 语 言 来 说 ，Rnust 开 源 社 区 也 是 语言 的 一 部 
分 。 同 时 ，Rust 语 言 也 是 属于 社区 的 。 

Rust 团 队 由 Mozilla 和 非 Mozilla 成 员 组 成 ， 至 今 13) Rust 项 目 贡献 者 
己 经 超过 了 1900 人 。Rust 团 队 分 为 核心 组 和 其 他 领域 工作 组 ， 针 对 Rnust 
2018 的 目标 ，Rnust 团 队 被 分 为 了 众 入 式 工 作 组 、CLI 工 作 组 、 网 络 工 作 
组 以 及 WebAssembly 工 作 组 ， 另 外 还 有 生态 系统 工作 组 和 社区 工作 组 
fe 
Ae 

这 些 领 域 中 的 设计 都 会 先 经 过 一 个 RFC 流 程 ， 对 于 一 些 不 需要 经 过 
RFC 尝 程 的 更 改 ， 只 需要 给 Rust 项 目 库 提交 Pull Request 即 可 。 所 有 的 过 
程 都 是 对 社区 透明 的 ， 并 且 页 献 者 都 可 参与 评审 ， 当 然 ， 了 最 终 决 案 权 归 
核心 组 及 相关 领域 工作 组 所 有 。 

Rust 团队 维护 三 个 发 行 分 文 : 稳定 版 CStable ) . wlth (Beta 
) 和 开发 版 CNightly ) 。 其 中 稳定 版 和 测试 版 每 6 周 发 布 一 次 。 标 记 
为 不 稳定 (Unstable ) 和 特性 开关 (Feature Gate ) 的 语言 特性 或 标 
准 库 特性 只 能 在 开发 版 中 使 用 。 


1.3.3 KE HI 


根据 社区 的 流行 度 调 奏 报告 ， 稚 全 2018 年 7 月 ， 由 Pull Request 统计 
的 GitHub ”Octoverse 报 告 显 示 ，Rust 语 言 的 总 PR 数 排 名 第 15 位 ， 呈 上 升 
趋势 。 从 活跃 的 项 目 数 来 看 ，Rust 语 言 一 共有 2604 个 活跃 项 目 。 

目前 在 商业 领域 ，Rust 的 重 磅 商业 用 户 增长 迅速 ， 其 中 包括 : 

` Amazon， 使 用 Rust 作 为 构建 工具 。 

- Atlassian, Œ Jain H Rust. 

Dropbox， 在 前 后 端 均 使 用 S Rust. 

“ Facebook, %HĦHRust 5 MBE HLEH. 


Google， 在 Fuchsia 项 目 中 部 分 使 用 了 Rust。 

Microsoft， 在 Azure IoT 网 络 上 部 分 使 用 了 Rnust。 

:npm， 在 其 核心 服务 上 使 用 了 Rnust。 

:RedHat， 使 用 Rust 创 建 了 新 的 存储 系统 。 

:Reddit， 使 用 Rust 处 理 评论 。 

Twitter， 在 构建 团队 中 使 用 Rust。 

除了 以 上 罗列 的 公司 ， 还 有 很 多 其 他 公司 ， 可 以 在 官方 Rust 之 友 页 
面 上 找到 ， 包 括 百 度 、 三 星 、Mozilla 等 。Rust 履 盖 了 数据 库 、 游 戏 、 云 
计算 、 安 人 全、 科学、 医疗 保健 和 区 块 链 等 领域 ， 相 关 的 工作 六 位 越 来 越 
多 。Rnust 的 前 景 越 来 越 明 衣 ， 未 来 Rust 将 大 有 可 为 。 


1.4 Rust 代 码 如 何 执行 


在 进一步 学 习 之 前 ， 我 们 有 必要 了 解 一 下 Rust 代 码 是 如 何 执行 的 。 
Rust 是 路 平台 语言 ， 一 次 编 详 ， 到 处 运行 ， 这 得 蔓 于 LLVM。Rnust 编 详 
璐 是 一 个 LLVM 编 译 前 端 ， 它 将 代 但 编译 为 LLVM IR， 然 后 经 过 LLVM 
编译 为 相应 的 平台 目标 。 

Rust ”源码 经 过 分 词 和 解析 ， 生 成 ”AST (抽象 语法 树 ) 。 然 后 把 
AST 进一步 简化 处 理 为 HIR (High-level IR) ， 目 的 是 让 编译 器 更 方便 
地 做 类 型 检查 。HIR 会 进一步 被 编译 为 MIR (Middle IR) ， 这 是 一 种 
中 同 表示， 它 在 Rust1.12 版 本 中 被 引入 ， 主 要 用 于 以 下 目的 。 

“ 绚 短 编译 时 间 。MIR 可 以 帮助 实现 增 量 编译 ， 当 你 修改 完 代 人 码 重 
新 编译 的 时 候 ， 编 译 右 只 计算 更 改过 的 部 分 ， 从 而 缩短 了 编译 时 间 。 

. 缩短 执行 时 间 。MIR 可 以 在 LLVM 编译 之 前 实现 更 细 粒 度 的 优 
化 ， 因 为 单纯 依赖 LLVM 的 优化 粒度 太 粗 ， 而 且 Rust 无 法 控制 ， 引 入 
MIR 束 增加 了 更 多 的 优化 空间 。 

更 精确 的 类 型 检查 。MIR 将 帮助 实现 更 灵活 的 借用 检查 ， 从 而 可 
以 提升 Rust 的 使 用 体验 。 

最 终 ，MIR 会 被 翻译 为 LLVM IR， 然 后 被 LLVM 的 处 理 编译 为 能 在 
各 个 平台 上 运行 的 目标 机 和 需 码 。 


1.5 小 结 


Rust 的 产生 看 似 偶然 ， 其 实 是 必然 。 未 来 的 互联 网 注重 安全 和 高 性 
能 是 必然 的 趋势 。GH 看 到 了 这 一 点 ，Mozilla 也 看 到 了 这 一 点 ， 所 以 两 
者 才能 一 拍 即 合 ， 创 造 出 Rust。 

Rust 从 2006 年 诞生 之 日 开始 ， 目 标 就 很 明确 一 追求 安全 、 并 发 和 
高 性 能 的 现代 系统 级 编程 语言 。 为 了 达成 这 一 目标 ，Rust 语 言 遵循 着 内 
存 安全 、 夫 成 本 抽象 和 实用 性 三 大 设计 哲学 。 借 助 现代 化 的 类 型 系统 ， 
赋予 了 Rust 语 言 高 级 的 抽象 表达 能 力 ， 与 此 同时 又 保留 了 对 底层 的 控制 
能 力 。 开 发 者 和 Rust 编 译 器 共享 着 同一 套 “ 心 智 模 型 "， 相 互信 任 ， 相 互 
协作 ， 最 大 化 地 保证 系统 的 安全 和 健壮 性 。 

Rust 语 言 有 别 于 传统 语言 的 另 一 点 在 于 ， 其 将 开源 社区 视 为 语言 的 
一 部 分 。Rust 本 身 就 是 开源 项 目 中 的 典范 ， 非 常 值得 学 习 。 通 过 本 章 的 
讲解 ， 希 望 可 以 帮助 读者 建立 对 Rust 语 言 的 系统 性 认 知 ， 在 以 后 的 学 习 
中 起 到 提纲 抒 领 的 作用 ， 不 至 于 迷失 在 细节 中 。 








[1] 20 世 纪 90 年 代 ， 欧 洲 空 间 局 阿坝 亚 娜 五 亏 运 载 火 箭 发 射 失败 ， 原 因 是 Ada 在 将 64 位 浮 点 数 转换 为 16 位 无 符 亏 整数 
IY, ACHES iih. 

[2] El The Rust Programming Language 。 

13] 写作 本 节 时 是 2018 年 7 月 。 
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在 学 习 一 门 攻 语言 的 时 候 ， 不 要 力求 一 次 性 就 掌握 它 的 全 部 ， 因 为 
那 古 不 可 能 做 到 的 事情 。 应 该 先 从 整体 出 友 ， 对 该 语言 的 语法 做 系统 性 
概 理 。 这 样 做 有 两 个 目的 : 第 一 ， 可 以 消除 对 该 语 言 的 阴 生 感 ， 第 二 ， 
可 以 对 基本 的 语法 建立 结构 化 的 知识 体系 。 
基于 上 述 认 知 ， 本 章 对 Rust 语 言 的 语法 要 点 进行 了 归纳 与 提炼 ， 基 
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练习 的 时 候 不 要 偷懒 。 


2.1 Rust 语 言 的 基本 构成 


Rust 语 言 主要 由 以 下 几 个 核心 部 件 组 成 : 
:语言 规范 

编译 器 

核心 库 

` 标准 库 

- Fil, er EH as 

2.1.1 语言 规范 


Rust 语 言 规 沁 主 要 由 Rust 语 言 参考 (The Rust Reference) 和 RFCX 
档 共 同 构 成 。 

Rust 语 言 参考 

Rust 语 言 参考 是 官方 团队 维护 的 一 份 参 考 文 档 ， 包 仿 了 三 类 内 容 : 

` 对 每 种 语言 结构 及 其 用 法 的 摘 述 。 

` 对 内 存 模型 、 并 发 模型 、 链 接 、 调 试 等 内 存 的 描述 。 

RUG a CTT AS EEA = 

该 参考 文档 不 算 Rust 语 言 的 正式 规范 ， 但 目前 官方 只 有 这 么 一 份 最 
接近 规范 的 文档 ， 在 不 久 的 将 来 ，Rust 官 方 会 出 一 份 正式 的 文档 。 虽 然 
该 文档 还 在 变更 中 ， 但 目前 也 可 以 作为 初学 者 的 参考 。 

RFC 文 档 

Rust 引 入 了 规范 化 的 RFC 流 程 ，RFC 文 档 是 涵盖 了 语言 特性 的 设计 
意图 、 话 细 衣 计 、 优 缺点 的 完整 技术 方案 。 社 区 中 的 每 个 人 都 可 以 提 
RFC， 经 过 社区 讨论 、 核 心 开 发 团队 评审 ， 通 过 之 后 才能 进入 其 体 实 现 
阶段 。 

Rust 源 人 码 中 也 规范 地 使 用 了 REFC 编 号， 来 对 应 相应 的 功能 特性 。 使 
用 RFC 的 好 处 是 ， 形 成 了 规范 化 的 文档 ， 利 于 方 采 实 施 和 后 期 维护 ， 利 
于 核心 开发 组 主导 项 目 进 展 方向 。Rust 学 习 者 也 可 以 通过 RFC 来 深入 了 


解 某 个 语言 特性 的 来 龙 去 脉 。 
2.1.2 Jm it #5 


Rnust 是 一 门 静 态 编译 型 语言 。Rust 官 方 的 编译 器 叫 rustc , Minky 
Rust 源 代码 编译 为 可 执行 文件 或 其 他 库 文 件 〈.a、.so、.lib、.dll 等 ) 。 
rustc 有 如 下 特点 : 
:rustc 是 路 平台 的 应 用 程序 ， 文 持 UNIX/Linux 等 类 UNIX 平 台 ， 也 文 
持 Windows 平 台 。 
rustc 文 持 交 叉 编 诺 ， 可 以 在 当前 平台 下 编译 出 可 运行 于 其 他 平台 
上 的 应 用 程序 和 库 。 
rustc 使 用 LLVM 作为 编译 妖 后 吴 ， 上 其 有 很 好 的 代码 生成 和 优化 技 
术 ， 文 持 多 个 目标 平台 。 
rustc 是 用 Rust 语 言 开发 的 ， 包 含 在 Rust 语 言 源 公 中 。 
rustc 对 Rust 源 人 码 进 行 词法 语法 分 析 、 评 态 类 型 检 本 ， 最 终 将 代码 
翻译 为 LLVM IR。 
rustc 输 出 的 错误 信息 非常 友好 和 评 尽 ， 是 开发 者 的 民 师 益友 。 


2.1.3 核心 库 


Rust 语 言 的 语法 由 核心 库 和 标准 库 共 同 提供 。 其 中 Rust 核 心 库 是 标 
准 库 的 基础 。 核 心 库 中 定义 的 是 Rust 语 言 的 核心 ， 不 依赖 于 操作 系统 和 
网 络 等 相关 的 库 ， 甚 至 不 知道 堆 分 配 ， 也 不 提供 并 发 和 LO。 

可 以 通过 在 模 英 项 部 引入 井 ! mo_std] 来 使 用 核心 库 。 核 心 库 和 标 
准 库 的 功能 有 一 些 重 复 ， 包 括 如 下 部 分 : 

. 基础 的 trait， 如 Copy、Debug、Display、Option 等 。 

基本 原始 类 型 ， 如 bool、char、i8/u8、i16/n16、i32/u32、 
i64/u64、isize/usize、f32/f64、str、array、slice、tuple、pointer 等 。 
音 用 功能 型 数据 类 型 ， 满 中 常见 的 功能 性 需求 ， 如 String、Vec、 
HashMap、Rc、Arc、Box 等 。 
- 第 用 的 宏 定义 ， 如 printlIn! ~ assert! ~ panic! ~ vec! 等 。 


做 能 入 式 应 用 开发 的 时 候 ， 核 心 库 是 必需 的 。 
2.1.4 标准 库 


Rust 标 准 库 提 供应 用 程序 开 及 所 需要 的 基础 和 路 平台 文 持 。 标 准 库 
包含 的 内 容 大 概 如 下 : 

与 核心 库 一 样 的 基本 trait、 原 始 数 据 类 型 、 功 能 型 数据 类 型 和 和 常用 
宏 等 ， 以 及 与 核心 库 几乎 完全 一 致 的 API。 

并 友 、UVO 和 运行 时 。 例 如 线程 模块 、 用 于 消 居 传递 的 通道 类 型 、 
Sync trait 等 并 发 模块 ， 文 件 、TCP、UDP、 管 道 、 套 接 字 等 常见 1/O。 

平台 抽象 。os 人 模块 提供 了 许多 与 操作 环境 交互 的 基本 功能 ， 包 括 

程序 参数 、 坏 境 变 量 和 目录 叶 航 ; 路 径 模 块 封 汲 了 处 理 文件 路 人 径 的 平台 
特定 规则 。 

- 慌 层 操作 接口 ， 比 如 std: : mem. std: : ptr. std: : intrinsics 
=, BEATE. tat. val Sn as AA K 

- FY ic A Eh eA EES AY Option#lResult, VAA AHA RASS o 


2.1.5 包 管 理 器 


把 按 一 定 规则 组 织 的 多 个 rs 文件 编译 后 束 得 到 一 个 包 (crate ) 。 
包 是 Rust 代 码 的 基本 编译 时 元 ， 也 是 程序 员 之 间 共 至 代码 的 基本 单元 。 

Rust 社 区 的 公开 第 三 方 包 都 集中 在 crates.io 网 站 上 和 面 ， 它 们 的 文档 被 
日 动 发 布 到 docs.rs 网 站 上 。 

Rustfe tt y JE 77 EY ‘ey EE as Cargo 。Rust 中 的 Cargo 类 似 于 
Ruby 中 的 bundler、Python 中 的 pp、Node.js 中 的 npm。 但 Cargo 不 仅 局 限 
于 包 管 理 ， 它 还 为 Rust 生 态 系 统 提供 了 标准 的 工作 流 。Cargo 能够 管理 
整个 工作 诉 程 ， 从 创建 项 目 、 运 行 单 元 测试 和 基准 训 试 ， 到 构建 用 布 链 
接 库 ， 再 到 运行 可 执行 文件 ， 等 等 。Cargo 为 开 肥 者 提供 了 极 大 的 方 
便 。 

在 安 半 好 Rust 环 境 之 后 ， 可 以 直接 使 用 Cargo 命 令 来 创建 包 。Cargo 
命令 的 示例 如 代码 清单 2-1 所 示 。 

代码 清单 2-1: cargo 命 令 示 例 


1. $ cargo new bin crate 


2. $ cargo new --lib lib crate 


在 代码 清单 2-1 中 ， 使 用 cargo new 命令 默认 可 以 创建 一 个 用 于 编写 
可 执行 二 进 制 文件 的 项 目 。 通 过 给 cargo new 命令 添加 --lib 参 数 ， 则 可 以 
创建 用 于 编写 库 的 项 目 。 此 外 ， 通 过 cargo _ build 和 cargo _ run 命令 可 以 方 
便 地 对 项 目 进行 编 诺 和 运行 。 


2.2 语句 与 表达 式 


Rust 中 的 语法 可 以 分 成 两 大 类 : 语句 (Statement ) 和 表达 式 
(Expression ) 。 话 句 是 指 要 执行 的 一 些 操 作 和 产生 副作用 的 表达 式 。 
表达 式 主要 用 于 计算 求 值 。 
语句 义 分 为 两 种 : 声明 语句 ( Declaration statement ) 和 表达 式 
语句 ( Expression statement ) 。 
声明 语句 ， 用 于 声明 各 种 语言 项 (Item) , RAHA eS, BA 
变量 、 第 量 、 结 构 体 、 图 数 等 ， 以 及 通过 extern 和 use 关 键 字 引 入 包 和 模 
块 等 。 
表达 式 语 句 ， 特 指 以 分 气 结尾 的 表达 式 。 此 类 表达 陈 求 值 结 果 将 
She SF, FPR IR CRA O. 
1a A) AU ZS IA SUA as Bl NRI 2-2 PAN 0 
代码 清单 2-2: 语句 和 表达 式 


1. // extern crate std; 
2. f/f use std: :prelude::vl::*; 
3. fin main() 4 
£ pub fn answer() -> (){ 
a let a = 40; 
6. let b = 2; 
7 assert eq! (sum(a, b), 42); 
8 } 
9 Bus En sumiar ta2, BE 132) “> A | 
iy a +b 
i [ia I } 
eF answer (); 
ky f 


在 代码 清单 2-2 中 ， 第 1 行 和 第 2 行 是 声明 语句 ， 它 们 并 不 需要 求 
值 ， 只 是 用 来 引入 标准 库 包 以 及 prelude 模 块 的 。 这 里 之 所 以 将 它们 注释 
把 ， 和 是 因为 Rust 会 为 每 个 crate 都 目 动 引 入 标准 库 模 块 ， 除 非 使 用 ## 


[no_std] 属 性 明确 指定 了 不 需要 标准 库 。 

然后 使 用 血 关 键 字 定义 了 两 个 函数 answer 和 sum。 关 键 字 人 是 
function 的 缩写 。 

图 数 answer 没 有 输入 参数 ， 并 且 返 回 值 为 单元 类 型 O 。 蛙 元 类 型 
TIA MEW, BCA, AS FATE, KZE -o $% 
元 类 型 的 概念 来 目 OCmal， 它 表示 “没有 什么 特殊 的 价值 ?>。 上 所 以 ， 这 里 
将 时 元 类 型 作为 函数 返回 值 ， 束 表示 该 函数 无 返回 值 。 当 然 ， 通 党 无 返 
器 值 的 函数 默认 不 需要 在 函数 签名 中 指定 返回 类 型 。 

在 函数 answer 中 ， 使 用 let 声 明了 两 个 变量 a 和 b， 其 后 必须 加 分 号 。 
assert_eq! 则 是 宏 语句 ， 它 是 Rust 提 供 的 断言 ， 人 允许 判 断 给 定 的 两 个 表 
IA SUK EG RE AAI). BORA A EWI SG ae, FFE DR eR BLE 
逢 调用 的 语句 ， 在 Rust 中 叫 作 安 。 

图 数 sum 的 两 个 输入 参数 和 返回 值 均 指 定 为 让 2 类 型 。 其 函数 体 只 包 
含 了 一 个 表达 式 ， 用 于 计算 a 与 b 的 值 ， 并 返回 。 

代码 清单 2-2 其 实 可 以 去 挥 换行 件 ， 完 全 写成 一 整 行 代 码 ， 而 不 影 
Nel Ae AP i PE o 

Rust3in HE 48 (ERAT TAS A fe, GOR ABI Ss, SAREE Ja 
Pir; WORMS), WTA; WRAP esl, WS eA sh 
求 值 ， 如 果 分 写 后 面 什么 都 没有 ， 束 会 补 上 单元 值 O 。 

当 人 过 到 函数 的 时 候 ， 会 将 函数 体 的 花 括 号 识别 为 块 表达 式 (Block 
Expression) 。 块 表达 陈 征 由 一 对 化 括号 和 一 系列 表达 式 组 成 的 ， 它 
总 是 返回 块 中 最 后 一 个 表达 式 的 值 ” 。 因 此 ， 对 于 answer 函 数 来 说 ， 它 
也 是 一 个 块 表 达 式 ， 块 中 的 最 后 一 个 表达 式 古 宏 语 句 ， 所 以 返回 时 元 值 
O 。 对 于 sum 函 数 来 说 ， 其 最 后 一 行 是 一 个 表达 式 ， 因 为 没有 分 号 ， 
所 以 直接 返回 其 求 值 结果 。 

从 这 个 角度 来 看 ， 可 以 将 Rust 看 作 一 切 冰 表达 式 。 由 于 当 分 号 后 面 
什么 都 没有 时 目 动 补 单元 值 〈) 的 特点 ， 我 们 可 以 将 Rust 中 的 语句 看 
作 计 算 结 果 均 为 () 的 特殊 表达 式 。 而 对 于 普通 的 表达 式 来 说 ， 则 会 得 
到 正常 的 求 值 结 


2.3 变量 与 绑 定 


通过 let 天 键 字 来 创建 变量 ， 这 是 Rust 语 言 从 函数 式 语 言 中 借鉴 的 语 
法 形式 。let 创 建 的 变量 一 般 称 为 绑 定 (Binding ) ， 它 表明 了 标识 符 
(Identifier) 和 全 (Value) 之 间 建 立 的 一 种 关联 天 系 。 


2.3.1 位 置 表达 式 和 值 表达 式 


Rust 中 的 表达 式 一 般 可 以 分 为 位 置 表达 式 ( Place Expression ) 和 
ERIA (C Value Expression ) 。 在 其 他 语言 中 ， 一 般 叫 作 左 值 
(LValue) MA (RValue) 。 

顾名思义 ， 位 置 表达 式 束 是 表示 内 存 位 置 的 表达 式 。 分 别 有 以 下 几 
ZB 

` 本 地 变量 

Hie 

-faH C*expr) 

- ZH RS] (expr[expr]) 

:字段 引用 Cexpr.field) 

` 位 置 表达 式 组 合 

通过 位 置 表达 式 可 以 对 某 个 数据 单元 的 内 存 进 行 读 写 。 主 要 是 进行 
写 操 作 ， 这 也 是 位 置 表达 式 可 以 被 赋值 的 原因 。 

除 此 之 外 的 表达 式 束 是 值 表达 式 。 值 表达 式 一 般 只 引用 了 某 个 存储 
单元 地 址 中 的 数据 。 它 相当 于 数据 值 ， 只 能 进行 谈 操 作 。 

从 语义 角度 来 说 ， 位 置 表达 取代 表 了 持久 性 数据 ， 值 表达 式 代 表 
了 临时 数据 。 位 置 表达 式 一 般 有 持久 的 状态 ， 值 表达 式 要 么 是 字面 
量 ， 要 么 是 表达 式 求 值 过 程 中 创建 的 临时 值 。 

表达 式 的 求 值 过 程 在 不 同 的 上 下 文中 会 有 不 同 的 结果 。 求 值 上 下 文 
也 分 为 位 置 上 下 文 (Place Context ) 和 信 上下文 (Value Context 
) 。 下 和 面 几 种 表达 式 属 于 位 置 上 下 文 : 

: 赋值 或 者 复合 赋值 语句 左 侧 的 操作 数 。 


一 元 引用 表达 式 的 独立 操作 数 。 

:包含 隐 式 借用 《〈 引 用 ) 的 操作 数 。 

match 判别 式 或 let 绑 定 右 侧 在 使 用 ref 模 式 匹 配 的 时 候 也 是 位 置 上 下 
Xe 

除了 上 述 几 种 情况 ， 其 余 表 达 式 部 属于 值 上 下 文 。 值 表达 式 不 能 出 
现在 位 置 上 下 文中 ， 如 代码 清单 2-3 所 未 。 
代码 清单 2-3: 值 表达 式 不 能 出 现在 位 置 上 下 文中 
pub fn temp() -> 132 { 

return 1; 
fn main() { 


let x = &temp(); 


= Cy GA ae te ho Fa 


temp() = *x; // error[E0070]: invalid left-hand side expression 


} 

代码 消 蛙 2-3 定 义 了 函数 temp。 在 main 疯 数 中 ， 使 用 temp 函 数 的 调 
用 放 到 了 赋值 语句 左边 的 位 置 上 下 文中 ， 此 时 编译 费 束 会 报错 。 因 为 
temp 国 数 调用 是 一 个 无 效 的 位 置 表达 式 ， 它 是 值 表 达 式 。 


2.3.2 不 可 变 绑 定 与 可 变 绑 定 


使 用 let 关 键 字 声明 的 位 置 表 达 却 默认 不 可 变 ， 为 不 可 变 绑 定 。 代 
但 清单 2-4 展 示 了 不 可 变 绑 定 与 可 变 绑 定 。 
Wiis 2-4: 不 可 变 绑 定 与 可 变 绑 定 


iL fn main() { 

2 let a = 1; 

S // a = 2; // immutable and error 
4 let mut b = 2; 

5 b = 3; // mutable 


6. } 

ERIA R2-4F, REAN EAEE, OEE E r AE a Sn 7 

EARE UMS 31a. Mmk, H UE AY Ay AR fi He 
IATL, BUATARSRE. APACE AY LIE EOE <- 


从 语义 上 来 说 ，let EU FAHEY ANY eSB ER Be RTE DY AITF ME J 
进行 谈 取 ， 而 let mut 声 明 的 可 变 绑 定 则 是 可 以 对 相应 的 存储 单元 进行 与 
入 的 。 


2.3.3 所 有 权 与 引用 


当 位 置 表达 式 出 现在 值 上 下 文中 时 ， 访 位置 表达 式 将 会 把 内 存 地 址 
转移 给 另外 一 个 位 置 表达 却 ， 这 其 实 古 所 有 权 的 转移 ， 如 代码 请 单 2-5 
所 示 。 

代码 清单 2-5: 所 有 权 和 转移 
1 fn main() { 

2 let placel = "hello"; 

3 let place2 = "hello: to string(); 

4 let other = placel; 

Obs prantine PET other) ; 

6 let other = place2; 

7 println! ("{:?}", other); // Err: other value used here after move 
8 


在 代码 清单 2-5 中 ， 使 用 let 声 明了 两 个 绑 定 ，placel 和 place2。 然 后 
将 placel 赋 信 给 新 的 变量 other. ALA placet 是 一 个 位 置 表达 式 ， 现 在 
出 现在 了 赋值 操作 人 符 右 侧 ， 即 一 个 值 上 下 文 内 ， 所 以 placel 会 将 内 丰 
地 址 转移 给 other . (AEE, place IMA H Hother, place2H) A 
地 址 同样 会 转移 给 other。 

代码 编 详 执行 以 后 ， 代 但 第 5 行 可 以 正 第 打印 other 的 什 ， 但 是 代码 
第 7 行 就 会 报错 ， 编 译 器 提示 “other value used here after move”， 此 提示 
的 意思 是 该 处 使 用 了 已 经 移动 的 值 。 为 什么 会 有 这 两 种 区 别 呢 ?这 其 实 
和 底层 内 存 安全 省 理 有 关系 。 这 两 种 行为 虽然 不 同 ， 但 都 是 Rust 为 了 你 
证 内 存 安 全 刻意 而 为 之 的 ， 在 第 3 章 中 会 有 更 评 细 的 解释 。 

在 语义 上 ， 每 个 变量 绑 定 实际 上 都 拥有 讼 存储 单元 的 所 有 权 ， 这 
种 转移 内 存 地 址 的 行为 束 是 所 有 权 (OwnerShip ) 的 转移 ， 在 Rust 中 
称 为 移动 (Move) 语义 ， 那 种 不 转移 的 情况 实际 上 是 一 种 复制 
(Copy) 语义 。Rust 没 有 GC， 所 以 完全 依靠 所 有 权 来 进行 内 存 管 理 。 


在 日 常 开 发 中 ， 有 时 候 并 不 需要 转移 所 有 权 。Rust 提 供 引 用 操作 符 
(& ) ， 可 以 直接 获取 表达 式 的 存储 单元 地 址 ， 即 内 存 位 置 。 可 以 通过 
该 内 存 位 置 对 存储 进行 读 取 。 引 用 操作 示例 如 代码 清单 2-6 所 示 ， 

代码 清单 26， 引 用 操作 示例 


0O no] @ o S w 


a. 
LQ. 
Nia MF 


La in main) 4 
1 let a = [1,2,3]; 
let b = & a; 
peinetin!i (901i? Bs #7 CeTErebeuscT 704 


let mut c = vec! [1,2,3]; 
let d = &mut c: 
d.push (4); 


EE LL (Pee) ls 74 [ip 2p Be 4] 
let e = &42; 


assert eq! (42, *e); 


在 代码 清早 2-6 中 ， 定 义 了 国定 长 度数 组 a， 并 日 使 用 引用 操作 符 & 
取得 a 的 内 存 地 址 ， 赋 值 给 b。 这 种 方式 不 会 引起 所 有 权 的 转移 ， 因 为 使 
用 引用 操作 人 符 已 经 将 赋值 表达 式 右 侧 变 成 了 位 置 上 下 文 ， 它 只 是 共享 内 
存 地 址 。 通 过 println! 宏 指 定 {: p} 格 式 ， 可 以 打印 b 的 指针 地 址 ， 也 就 


征 内 存 地 址 。 


同时 ， 也 通过 let mnut 声 明了 动态 长 度数 组 c。 然 后 通过 &mnut 获 取 c 的 
可 变 引 用 ， 赋 值 给 d4。 调 用 d 的 push 方 法 插入 新 的 元 系 4。 注 意 ， 要 获取 
可 变 引 用 ， 必 须 先 声明 可 变 绑 定 。 

对 于 字面 量 42 来 说 ， 其 本 喘 属 于 值 表达 陈 。 通 过 引用 操作 人 符 ， 相 
当 于 值 表达 式 在 位 置 上 下 文中 进行 求 值 ， 所 以 编译 右 会 为 &42 创 建 一 个 
临时 值 ， 如 代码 清早 2-7 所 示 。 

代码 清单 2-7: 值 表 达 式 在 位 置 上 下 文中 求 值 时 会 被 创建 临时 值 


ls Aer mut Us £1227 
2 let mut 1% 1323 
3. l = const 42132; 
4 


0 = & 1; 


代码 清单 2-7 是 编译 器 为 lat e=&42 创 建 临 时 值 的 示意 代码 ， 仅 用 于 
演示 。 

最 后 ， 通 过 解 引用 操作 符 * 将 引用 e 中 的 值 取出 来 ， 以 供 assert_eq ! 
TE (8 FA o 

从 语义 上 来 襄 ， 不 官 是 &a 还 是 &mut c， 痢 相当 于 对 a 和 c 有 所 有 权 的 借 
用 ， 因 为 a 和 c 还 依旧 保留 它们 的 所 有 权 ， 所 以 引用 也 被 称 为 借用 。 


2.4 KAS HE 


HU COZ ADRAR, He aE main 函数 ， 它 代表 程 
FRAO o PP ae AT AT OC PPR, main žin. ET Jee 
PAK, main k AYA A 2B I o 


2.4.1 函数 定义 


通过 前 文 我 们 也 了 解 到 ， 郴 数 是 通过 关键 字 锯 定义 的 ”“。 这 种 关键 
字 使 用 了 极 简 缩写 ， 这 也 算是 Rust 独 有 的 一 种 风格 ， 不 仪 仪 是 全， 还 有 
很 多 其 他 关键 字 都 使 用 了 缩写 。 有 些 声 学 者 可 能 不 太 豆 欢 这 样 缩 号 ， 但 
是 习惯 之 后 ， 这 种 想法 就 会 改变 。 

fe BORE M—PFizzBuzzPi av. FizzBuzzek ÓR: 输入 一 个 数 
字 ， 当 数字 是 3 的 倍数 时 ， 输 出 fizz; 当 数 字 是 5 的 倍数 时 ， 输 出 buzz; 
当 数 字 是 3 和 5 共同 的 倍数 时 ， 输 出 fizzbuzz; 其 他 情况 返回 访 数 字 ， 如 
代码 清单 2-8 所 示 。 

代 公 清单 2-8: FizzBuzzeK ŽUR ÝI 


le PUD fh fizz Buzz Moms 1324) -> String { 


Zs if num 4 15 == 0 { 

ER CECEN “LIZZIE ce SEELIG i)? 

4. } else if num % 3 == 0 { 

Js return "iizz oto string () 5 

or } else if num % 5 == 0 { 

F Perle, “Puzza = TO String) 3 

8 . f els& 1 

Ja return MN to string () > 

T0; } 

ila ARR 

le. En maingi 

Le assert eq! (fizz bugz(lo), “Eiezbuga".co string) )? 
14. assert Sai (CTL223 DU22 13); “Lizz «te erring): 
LS Meer Bi (TL22 DU22 (37; “De .Eo String) )} 
t6. assert eg! (haze DUZE (13); La" .be string:() ); 
Lye J 


hs 2-8 FE A in BEF FE MS fizz_buzzesi a, eR ALS 4 pub 
fn fizz_buzz (num: i32) -String 清晰 地 反映 了 函数 的 类 型 约定 : 传 
入 i32 类 型 ， 返 回 String 类 型 。Rust 编 译 硕 会 严格 巡 守 此 类 型 的 淖 约 ， 
如 果 传 入 或 返回 的 不 是 约定 好 的 类 型 ， 则 编译 时 会 报错 。 

我 们 从 前 文中 已 经 知晓 ， 图 数 体 是 由 花 插 号 括 起 来 的 ， 它 实际 上 是 
一 个 块 表 达 式 ， 最 终 只 人 返回 块 中 最 后 一 个 表达 式 的 求 值 结果 。 如 果 想 提 
六 返回， 则 需要 使 用 retum 关 键 字 。 请 参考 代码 清单 2-8。 

return 表达 陈 用 于 退出 一 个 函数 ， 并 返回 一 个 值 。 但 是 如 果 return 
后 面 没有 值 ， 束 会 默认 人 返回 时 元 值 。 

代码 清单 2-8 中 使 用 了 to_string 方 法 ， 它 将 表达 式 的 求 值 结果 转 换 为 
String 类 型 。Rust 中 的 字符 串 类 型 不 仅 包 括 String 类 型 ， 第 8 章 讲 字符 串 
的 时 候 会 介绍 更 多 相关 内 容 。 


2.4.2 作用 域 与 生命 周期 


Rust 语言 的 作用 域 是 静态 作用 域 ， 即 词法 作用 域 (Lexical 
Scope) ”。 由 一 对 兹 括 写 来 开 尽 作 用 域 ， 其 作用 域 在 词法 分 析 阶 段 束 已 


经 确定 了， 不 会 动态 改变 。 词 法 作用 域 如 代码 清香 2-9 所 示 。 
Sis 22-9: 词法 作用 域 示 例 


I fn main() { 

2 let v = "hello world!"; 

3 assert eq! (v, "hello world!"); 

4 let y = "hello Rust!"; 

Se assert eq! (v; “hello Rusti")? 

6 { 

7 let v = "hello World!"; 

8 assert eg! (V, “hello World!) ; 
9 } 

10. assert eqliv, "hello Rusti"; 


Lie f 


ERIR 2-97, TRAST y BAST AENA ST EERE, JME 
为 hello world! ， 然 后 通过 断言 验证 其 值 。 再 次 通过 let 声明 变量 绑 定 
v, WME hello Rust! 。 这 种 连续 用 let 定 义 同 名 变量 的 做 法 叫 杰 量 遮 责 

(Variable Shadow ) 。 但 是 最 终 的 变量 Vv 的 值 是 由 第 二 个 变量 定义 所 决 

定 的。 变量 遮蔽 可 以 为 日 党 开发 提供 诸多 方便 。 

代码 第 6 行 到 第 9 行使 用 兹 括 写 开 习 了 一 个 块 空间 ， 它 实际 上 是 一 上 段 
词法 作用 域 。 其 中 同样 使 用 let 声 明了 变量 绑 定 v， 赋 值 为 hello 
World! 。 

代码 第 10 行 使 用 宏 断 言 assert_eq! 验证 Vv 的 值 ， 该 值 依然 等 于 hello 
Rust! ， 并 没有 因为 块 代 码 中 的 重新 声明 而 发 生 改变 。 

这 证 明 ， 在 词法 作用 域内 部 使 用 花 括 写 开 说 新 的 词法 作用 域 后 ， 两 
个 作用 域 是 相互 独立 的 。 在 不 同 的 词法 作用 域内 声明 的 变量 绑 定 ， 拥 有 
不 同 的 生命 周期 (LifeTime ) 。 尽 管 如 此 ， 变 量 绑 定 的 生命 周期 总 是 
遵循 这 样 的 规律 : 从 使 用 let 声明 创建 变量 绑 定 开始 ， 到 超出 词法 作用 
域 的 范围 时 疆 


2.4.3 函数 指针 


在 Rust 中 ， 函 数 为 一 等 公民 o KARE, MAA AeA DEA 


数 的 参数 和 返回 值 使 用 。 
代码 清单 2-10 展 示 了 函数 作为 参数 的 情况 。 
代码 清单 2-10: 函数 作为 参数 的 情况 


} 
fn 


} 
fn 


iS =~] CG Ct = GW ho F 


| 
ED ë y 


} 
. BD 


=e Fs Fe FY 记 
Oo WB W N FF 


. | 


Due Ti Mach (Go: To (132; dog) -~ Iia Bf Laz, Di 132) -> Lda 


op(a, b) 


ml 132, Bt 132) -F 132 { 
a+b 


productias 252, Di 2324) “> Loe 1 


arp 


main () { 

Let gS 2? 

let b = 3; 

aBeecrt Sg. (MATCHS a; Ble 3)? 
assert, eg: (math (produch, a, b), 6); 


FEMS 2-104, EX Sek Mmath, HARASA ETNEN 
fn (i32, i32) ->i32284, wm fERust PKA Cin pointer) KW., 


在 main 函 数 中 ， 调 用 了 math 函 数 两 次 ， 分 别传 入 了 sum 和 product 作 


为 参数 。 


而 sum 和 product 分 别 是 用 于 求 和 和 求 积 的 两 个 函数 ， 它 们 的 类 


型 是 fn (i32, i32) -> 让 2， 上 所 以 可 以 作为 参数 传 给 math 国 数 。 注 意 这 里 
直接 使 用 函数 的 名 字 来 作为 图 数 指针 。 

图 数 也 可 以 作为 返回 值 使 用 ， 如 代码 清单 2-11 所 示 。 

代码 清单 2-11: 函数 作为 返回 值 的 情况 


js 


Nn e WW hd 


fn is trust) 一 > Dool {q true j 
rn true maker() => fn() => bool { 16 true } 
fn main() { 


assert eq! (true _maker() (), true); 


在 代码 清单 2-11 F, FEM T PRAM is true, JRE] true. WE X J AŽ 
true_maker, iK|Elfn © ->bool 类 型 ， 其 函数 体内 直接 将 is_true 函数 指 
‘TIBI. TERUG SAA SEAS et, WRI ES, wt 
会 调用 该 函数 。 

在 main PR ACH SH, true maker O ©) 调用 相当 于 

(true maker () ) ©) . cil Htrue maker () ， 会 返回 is truerki žit 
BET: 然后 再 调用 is_true () 函数 ， 最 终 得 到 true。 


2.4.5 CTEE 机 制 


Rust 编 详 右 也 可 以 像 C++ 或 D 语 言 那 样 ， 拥 有 编译 时 函数 执行 
(Compile-Time Function Execution, CTFE) 的 能 力 。 在 Rust 2018 版 
本 的 首 个 语义 化 版 本 ”1.30 中 ，CTFE 的 一 个 最 小 化 子 集 已 经 稳定 了 。 在 
该 版 本 之 前 ， 如 果 想 使 用 此 功能 ， 必 须 使 用 Nightly Rust 版 本 。 代 码 清单 
2-12 展 示 了 使 用 CTFE 功 能 的 一 个 示例 一 一 const fn 示例 。 
代码 清单 2-12: const fn 示例 
1. //#![feature(const fn) ] 





2 const fn Init len) => usize 4 
3; return 5; 

4. } 

3 fn main() { 

6 let arr = [0 init len()]; 
7 } 


在 代码 清单 2-12 中 ， 使 用 了 const fn 来 定义 函数 init_len， 该 函数 返回 
一 个 固定 值 5。 并 且 在 main 函 数 中 ， 通 过 [0;， N] 这 种 形 却 来 初始 化 仿 始 
值 为 0、 长 度 为 N 的 数组 ， 其 中 N 是 由 调用 函数 init len 来 求 得 的 。 

Rust “中 国定 长 度 的 数组 必须 在 编 详 期 束 知 道 长 度 ， 人 否则 会 编 详 出 
fH. PUPA init lenses HRA. ete CTFE 的 能 力 。 注 
m, (H Rust 2018 AMAT, AEH! [feature (const fn) ] 特 性 ; 
而 使 用 Rust 2015 版 本 时 ， 还 需要 加 此 特性 。 使 用 const 血 定义 的 函数 ， 
必须 可 以 确定 值 ， 不 能 和 存在 上 收 义 。 与 血 定 义 函 数 的 区 别 在 于 ，const fn 可 
以 强制 编译 右 在 编译 期 执行 函数 。 其 中 关键 字 const 一 般 用 于 定义 全 局 名 


=I 


一 


量 。 

除了 const tn， 官方 还 在 实现 const generics 特 性 。 支 持 const generics 
特性 ， 将 可 以 实现 类 似 impl 二 T，const N: usize>Foo for [T; N]{...} 的 
代码 ， 可 以 为 所 有 长 度 的 数组 实现 triat Foo。 那 么 使 用 数组 的 体验 将 会 
得 到 很 大 的 提升 。 

Rust 中 的 CTEFE 是 由 miri 来 执行 的 。miri 是 一 个 MIR 解 释 磺 ， 目 前 
已 经 被 集成 到 了 Rust 编 译 器 rustc 中 。Rust 编译 器 目前 可 以 支持 的 常量 
表达 式 有 : FHE, WA, ZH, FRAKA, MA KEE RITARA 
的 块 表达 式 、 苑 围 等 。Rust 想 要 拥有 完善 的 CTFE 文 持 ， 还 有 很 多 工作 
要 做 。 


2.4.6 HE, 


闭 包 也 叫 匿 名 函数 。 财 包 有 以 下 几 个 特 扣 : 
“ 可 以 像 函数 一 样 被 调用 。 

可 以 捕获 上 下 文 环 境 中 的 目 由 变量 。 

可 以 目 动 推断 输入 和 返回 的 类 型 。 

代码 清单 2-13 展 示 了 一 个 财 包 的 示例 。 
代码 清单 2-13: 闭 包 示例 


Le ER Maan) 4 

Zi let out = 42; 

E ‘i TH aaae Le Fi 124) WE 
4. Ei Mas Leg, T: aoc] “> Let te 

Dh let closure annetabed = jis i32, J: 134] => 132 { 1 + 4 + Ou}; 
6. let closure interred = |iy J| 2 + J + out; 

Ta let 1 = 1; 

0 let j = 2; 

Dy. assert eq! (3, add(1, 3)); 

10. assert eq! (45, closure annotated(1, J)); 

a ig SSS6rt E0: Goy Closure iiterrédii, 1) )% 

Le» |} 


FEASTS 2-13 P, Œ main KAPEN T Ah Pee Be add, VA 


及 两 个 闭 包 closure annotated 和 closure inferred. 

闭 包 调用 和 函数 调用 非常 像 ， 如 代码 第 9 行 到 第 11 行 所 示 。 但 古 闭 
包 和 函数 有 一 个 重要 的 区 别 ， 那 束 是 闭 包 可 以 捕获 外 部 人 变量， 而 函数 
不 可 以 ” 。 如 代码 第 3 行 ， 在 add 函 数 内 使 用 外 部 定义 的 变量 out， 编 译 器 
会 报错 。 但 是 代码 第 5 行 和 第 6 行 定 义 的 闭 包 就 可 以 直接 使 用 out。 

闭 包 也 可 以 作为 函数 参数 和 返回 值 ， 但 使 用 起 来 略 有 区 别 。 代 人 码 清 
单 2-14 展 示 了 闭 包 作为 参数 的 情况 。 

代码 清单 2-14: 闭 包 作为 参数 的 情况 


rH closure Wachee FAU =F 1327 (0p: Fi => 134 4 
2 op () 

3 } 

4 fn main ({) { 

sP let & = 2% 

6 let b = 3; 

J assert eq! (math(|| a + b), 5); 

8 assert eq! (math(|| a * b), 6); 

9 } 


在 代码 清单 2-14 F, X J KAŽ closure_math， 其 参数 是 一 个 泛 型 
F， 并 且 该 泛 型 受 Fn O ->i32 trait 的 限定 ， 代 表 该 函数 只 人 允许 实现 
Fn (©) ->i32 trait 的 类 型 作为 参数 ，。 

Rust 中 闭 包 实际 上 就 是 由 一 个 匿名 结构 体 和 trait 来 组 合 实 现 的 
所 以 ， 在 main 函 数 调用 math 函 数 的 时 候 ， 分 别传 入 lla+b 和 llaxb 这 两 个 闭 
包 ， 都 实现 了 Fn O ->i32。 在 math 函 数 内 部 ， 通 过 在 后 面 添 加 一 对 圆 
括 写 来 调用 传 入 的 闭 包 。 

财 包 同样 也 可 以 作为 返回 值 ， 如 代码 清单 2-15 所 示 。 

代码 清单 2-15: 闭 包 作为 返回 值 的 情况 

ie fh two tines tpl) -> impl EnN(132) -> 232 4 
2 let i = 2; 

P move |j| j * 1 

4 } 


5 fn main(){ 

Di let result = two times impl(); 
7 assert eq! (result(z), 4); 

8 


} 


在 代码 清单 2-15 中 使 用 了 impl Fn (i32) ->i32/EN RAIMA, 
它 表示 实现 Fn (i32) -之 i32 的 类 型 。 在 函数 定义 时 并 不 知道 具体 的 返回 
类 型 ， 但 是 在 函数 调用 时 ， 编 译 需 会 推 新 出 来 。 这 个 过 程 也 是 零 成 本 抽 
象 的 ， 一 切 都 发 生 在 编译 期 。 

需要 注意 的 是 ， 在 函数 two_times_impl 中 最 后 返回 闭 包 时 使 用 了 
move 关键 字 。 这 是 因为 在 一 般 情况 下 ， 闭 包 默 认 会 按 引 用 捕获 变量 。 
如 果 将 此 财 包 返回 ， 则 引用 也 会 跟着 返回 。 但 是 在 整个 水 数 调用 完毕 之 
后 ， 函 数 内 的 本 地 变量 i 就 会 被 销毁 。 那 么 随 闭 包 返 回 的 变量 ii 的 引 
用 ， 也 将 成 为 悬垂 指针 。Rust 是 注重 内 存 安全 的 语言 ， 绝 对 不 会 让 这 种 
事情 发 生 。 所 以 如 果 不 使 用 move 关 键 字 ， 编 译 器 会 报错 。 使 用 move 关 
键 字 ， 将 捕获 变量 i 的 所 有 权 转 移 到 闭 包 中 ， 束 不 会 按 引 用 进行 捕获 变 
量 ， 这 样 财 包 才 可 以 安全 地 返回 。 

在 第 5 章 中 还 会 讲述 更 多 关于 闭 包 的 内 容 。 


2.5 流程 控制 


一 般 编 程 语言 午 会 有 第 用 的 流程 控制 语句 : 条 件 语句 和 循环 语句 ， 
Rust 也 不 例外 。 但 是 在 Rust 中 不 叫 流程 控制 语 名 ， 而 叫 沉 程控 制 表 达 
Io 


2.5.1 条 件 表 达 式 


表达 式 一 定 会 有 值 ， 所 以 if 表 达 式 的 分 文 必须 返回 同一 个 类 型 的 值 
才 可 以 。 这 也 是 Rust 没 有 三 元 操作 符 ? > 的 原因 。if 表 达 式 的 求 值 规则 
和 块 表达 式 一 致 。 

if 表 达 式 如 代码 清单 2-16 所 示 。 

代码 清单 2-16: 证 表达 式 


j aps fn marin) 


2% let n = 13; 

3:5 let big n= if in x 10 && n > =-10) { 
4. LOU = fi 

Fa } else { 

6. ny 2 

I. be 

P assert eq! (big n; 6); 

9. } 


在 代码 清单 2-16 中 ， 变 量 绑 定 big_n 的 赋值 是 由 一 个 if 表 达 式 来 完成 
的 。 通 过 计算 n 的 区 间 大 小 ， 来 决定 最 终 的 值 。 因 为 n 是 整数 13， 虽 然 没 
有 明确 指定 类 型 ， 但 Rust 编 译 妖 会 默认 推断 其 为 132 类 型 。 在 if 条 件 分 文 
中 ， 对 n 求 积 得 到 的 结果 肯定 是 整数 。 在 else 分 支 中 ， 按 直觉 来 说 ，n 除 
以 2 应 该 是 小 数 6.5 才 对 。 但 是 如 果 是 小 数 ，if 和 else 分 支 的 求 值 结果 类 型 
会 不 一 改 ， 编 译 右 会 不 会 报错 ? 

其 实 这 里 不 需要 担心 ， 因 为 big_n 的 类 型 已 经 被 Rust 编 译 器 根据 上 下 
文 默认 推断 为 让 2 类 型 。 类 型 已 经 确定 了 ， 所 以 在 计算 n 除 以 2 的 时 候 ， 
Rust 编 译 右 会 将 结果 进行 截取 ， 去 除 小 数 点 后 面 的 部 分 。 最 终 big_n 的 值 


2.5.2 JA RIA IN 


Rust 中 包括 三 种 循环 表达 式 : while、loop 和 for...in 表 达 式 ， 其 用 法 
和 其 他 编程 语言 相应 的 表达 式 基 本 类 似 。 

现在 我 们 用 for...in 表 达 式 来 实现 FizzBuzz， 如 代码 清 时 2-17 所 示 。 

代码 清单 2-17: 用 for...in 表 达 式 实现 FizzBuzz 


ILs «= fn Moly 1 

; for o im dag LOL 1 

Bis if n % 15 == 0 { 

4. pEAnE LH! ("Ligzouze T]? 
Wa } else if n % 3 == Q0 { 
6. prancin! ("frac : 
Tyg } else if n % 5 == 0 { 
8. PLINELN! (“Boge”) % 

9 . | élse | 

Li a peinbpimi i ai pe» mes 
Ll g } 

12. } 

i: | 


在 代码 清单 2-17 中 ，for...in 表 达 式 本 质 上 是 一 个 迭代 器 。 其 中 
1..101 是 一 个 Range 类 型 ， 它 是 一 个 欠 代 器 。for 的 每 一 次 循环 都 从 欠 代 
器 中 取 值 ， 当 运 代 堪 中 没有 值 的 时 候 ，for 循 环 结束 。 第 5 章 会 介绍 关于 
Aas ES A. 

FEA YAS BP AY WAR BI EA while loop#a t WY FizzBuzz~ Bil . 
这 里 值得 注 意 的 是 ， 当 需要 使 用 无 限 循 环 的 时 候 ， 请 务必 使 用 loop 循 
H, mE H while true 循 环 。 代 码 清单 2-18 展 示 了 使 用 while true 循 环 的 
情况 ， 我 们 看 看 会 产生 什么 后 果 。 

代码 清单 2-18: 使 用 while true 循 环 示例 


fn while trues (xi 132) <> L34 { 
while true { 
return TL 
} 
} 
fn main() { 
let y = while true(9); 
assert eq! (y, 6); 


Oo DOAN OF WN F 


} 


代码 清单 2-18 中 定义 了 图 数 while_true， 其 中 while 循 环 条 件 使 用 了 
便 编 码 true， 目 的 是 实现 无 限 循环 。 这 种 看 似 非常 正确 的 代码 会 引起 
Rustin tE AFR E o 

错误 提示 称 while trueff HRR EAE, M K Bwhile_trueik 
回 值 是 2， 所 以 不 匹配 。 但 是 在 while true 循 环 中 使 用 了 returm KEF, 
应 该 返回 让 2 类 型 才 对 ， 为 什么 会 报错 呢 ? 

这 是 因为 Rust 编 译 回 在 对 while 循 环 做 流 分 析 (Flow Sensitive ) 的 
时 候 ， 不 会 检查 循环 条 件 ， 编 详 需 会 认为 while 循环 条 件 可 真 可 假 ， 所 
以 循环 体 里 的 表达 式 也 会 被 忽略 ， 此 时 编译 器 只 知道 while true 循 环 返 回 
的 是 单元 值 ， 而 函数 返回 的 是 让 2， 其 他 情况 一 概 不 知 。 这 一 切 都 是 因 
为 CTFE 功能 的 限制 ，while 条 件 表达 式 无 法 作为 编 ES Th BOK H o 

只 有 等 将 来 CTFE 功 能 完善 了 ， 才 可 以 正常 使 用 。 同 理 ，if true 在 只 有 一 
条 分 支 的 情况 下 ， 世 会 发 生 类 似 情况 。 
修复 此 错误 也 很 容易 ， 如 代码 清单 2-19 所 示 。 
代 公 清早 2-19:， while true 错 误 修 复 


in while true(x: 132) -> 132 1 


while true { 


} 


1 
2 
3 return xli 
4 
5 x 

6 . 


} 
在 代码 清单 2-19 中 ， 在 while true 函数 的 最 后 一 行 〈 第 5 行 ) J xÆ 


量 ， 这 是 为 了 让 编译 器 以 为 返回 的 类 型 是 让 2 类 型 。 但 实际 上 ， 程 序 在 
运行 以 后 ， 将 永远 在 while true 循 环 中 执行 。 


2.5.3 match 表 达 式 与 模式 匹配 


Rnust 提 供 了 match 表 达 式 ， 如 代码 清单 2-20 所 示 。 
代码 清单 2-20: match 表 达 式 


Le ø Maan() 4 

fi let number = 42; 

Se match number { 

4. 0 => PRIN LLG! ATOL G10" , 

as leans = BEAM A (PALL), 

6. iS | 7 | 13 => printin! ("Bad Luck”), 
Ve n @ 42 => printin! ("Answer is {}", n), 
8 . 四 

9. } 

Lie. i 


在 代码 清单 2-20 中 ，match 用 于 匹配 各 种 情况 。 有 点 类 似 其 他 编程 
语言 中 的 Switch 或 case 语 句 。 

在 Rust 语 言 中 ，match 分 文 使 用 了 模 陈 匹配 (Pattern Matching ) 
技术 。 酝 式 匹 配 在 数据 结构 字符 串 中 经 第 出 现 ， 比 如 在 茶 个 字符 串 中 找 
出 与 该 子 串 相同 的 所 有 子 串 。 在 编程 语言 中 ， 模 式 轧 配 用 于 判断 类 型 或 
值 是 否 和 存在 可 以 匹配 的 模式 。 模 式 昂 配 在 很 多 函数 式 语言 中 已经 被 三 泛 
应 用 。 

在 Rust 语 言 中 ，match 分 文 左边 就 是 模式 ， 右 边 就 是 执行 代码 
模式 匹配 同时 也 是 一 个 表达 式 ， 和 刘表 达 式 类 似 ， 所 有 分 支 必须 返回 同 
一 个 类 型 。 但 是 左 侧 的 模式 可 以 是 不 同 的 。 代 码 清单 2-20 中 使 用 的 檬 式 
分 别 是 单个 值 、 沁 围 、 多 个 值 和 通配符。 其 中 值得 注意 的 是 ， 在 代码 第 
7 行 中 ， 使 用 操作 人 符 @ 可 以 将 模式 中 的 值 绑 定 给 一 个 变量 ， 供 分 文 右 侧 
的 代码 使 用 ， 这 类 匹配 叫 绑 定 模式 (Binding Mode ) 。match 表 达 式 必 
须 尽 每 一 种 可 能 ， 所 以 一 般 情 况 下 ， 会 使 用 通配符 _ 来 处 理 剩余 的 情 
ILo 


除了 match 表 达 式 ， 还 有 let 绑 定 、 函 数 参数 、for 循 环 等 位 置 都 用 到 
了 模式 匹配 ， 在 后 面 草 节 中 我 们 会 陆续 看 到 相关 示例 。 


2.5.4 if let 和 while let 表 达 式 


Rust 还 提供 了 if ”let 和 while let 表达 式 ， 分 别 用 来 在 某 些 场合 蔡 代 
match 表 达 式 。 使 用 if let 表 达 式 的 代码 如 代码 清单 2-21 所 示 。 
Rie 2-21: 使 用 if let 表 达 式 


‘ie fn main() { 

Bs let boolean = true; 

J let mut binary = 0; 

4. if let true = boolean { 
5m binary = 1; 

G } 

Ta assert. eq! (binary; 1) +s 
Da } 


代码 清 日 2-21 中 使 用 了 if let 表 达 式 ， 和 match 表 达 式 相似 ，if let% (ill 
为 模式 ， 碳 侧 为 要 匹配 的 值 。 该 代码 表示 binary 默 认为 0， 如 有 果 boolean 
为 tue， 则 将 binary 的 值 修改 为 1。 

在 使 用 循环 的 荣 些 场合 下 ， 也 可 以 使 用 while jlet 来 窗 化 代码 。 我 们 
先 来 看 不 使 用 while let 表 达 式 ， 而 使 用 match 表 达 式 的 情况 ， 如 代码 清单 
2-22 FAR o 

代码 清单 2-22: 使 用 match 表 达 式 
fn main() { 

let mut y = wed! (1, 2,0. 24,5] ? 

Loop 4 

match v.pop() { 
Some (x) => println! ("{}", x), 


None => break, 


Oo EO sd O OO SP WN F 


FEASTS 2-224, Bie Sonata, FAA BOR PY oR 
过 pop 方 法 依次 取出 来 并 打印 。 此 处 使 用 loop 循 环 ， 因 为 调用 v 的 pop 方 
法 会 返回 Option 类 型 ， 所 以 用 match 死 配 两 种 情况 ，Some (x) 和 None。 
Rust 中 引入 Option 类 型 是 为 了 防止 空 指针 的 出 现 。Some (x) 用 于 匹配 
数组 中 的 元 系 ， 而 None 用 于 匹配 数组 被 取 至 的 情况 。 当 数组 取 空 时 ， 
束 从 循环 中 跳出 Cbreak) 。 

这 段 代 人 码 比 较 烦 开 ， 因 为 第 6 行 代码 其 实 什 么 都 没 做 ， 只 是 跳出 循 
环 而 已 。 使 用 while let 正 好 可 以 人 简化 这 段 代 码 ， 如 代码 清单 2-23 所 示 。 

isis 442-23: 使 用 while let (67005 


Le Fi maini) 

nn let mut. vy = vec! ([l1,.2,3,4,5];7 
3 while let Some(x) = v.pop() { 
4. Prac eae SED 

SP } 

6. } 


代码 清单 2-23 使 用 了 while let#eIA TK. Sif let 类 似 ， 其 左 侧 
Some (x) 为 由 配 模 式 ， 它 会 下 配 右 侧 pop 方 法 调用 返回 的 Option 类 型 结 
果 ， 并 自动 创建 x 绑 定 供 printlIn! 宏 语 句 使 用 。 如 果 数 组 中 的 值 取 空 ， 则 
自动 跳出 循环 。 


2.6 基本 数据 类 型 
Rust 提 供 了 很 多 原始 基本 数据 类 型 ， 下 面 分 别 介绍 它们 。 


2.6.1 布尔 类 型 





Rust 内 置 了 布尔 类 型 ， 类 型 名 为 bool。bool 类 型 只 有 两 个 值 
和 false， 其 示例 如 代码 清单 2-24 所 示 。 
代码 清单 2-24: bool 类 型 示例 


true 


assert Eq! (x as 132, 1); 


assert eq! (y as 132, 0); 


i R fn main() { 

aa let x = true; 

Fa let y: bool = false; 

4. let x = D; 

S, EL "R 18 Bagger than 1”) 7: 
6 

Fa 

8 


T 
在 代码 清单 2-24 中 ， 第 2 行 和 第 3 行 声明 x 和 y 绑 定 的 写法 是 等 价 的 。 
对 于 x 比 定 ，Rust 可 以 目 动 推 半 其 类 型 为 bool。 当 然 也 可 以 像 声 明 y 那 样 
显 式 地 指定 其 类 型 为 bool。 

任意 一 个 比较 操作 都 会 产生 bool 类 型 ， 如 第 5 行 代码 所 示 。 

也 可 以 通过 as 操作 符 将 bool 关 型 转换 为 数字 0 和 1。 但 要 注意 ，Rnust 
并 不 文 持 将 数字 转换 为 bool 类 型 。 


2.6.2 基本 数字 类 型 
Rust 提 供 的 基本 数字 类 型 大 致 可 以 分 为 三 类 : 固定 大 小 的 类 型 、 动 
态 大 小 的 类 型 和 浮 点 数 ， 分 别 介 绍 如 下 。 


国定 大 小 的 类 型 包括 无 从 写 整 数 (Unsigned Integer) 和 符号 整数 
(Signed Integer) 。 其 


中 ， 无 从 写 整 数 包括 : 


>u8, 数值 范围 为 0 一 28-1 ， 占用 1 个 字 节 。u8 类 型 通常 在 Rust 中 表 
示 字 节 序 列 。 在 文件 IO 或 网 络 VO 中 读 取 数据 流 时 需要 使 用 u8。 


>u16， 数 值 范围 为 0 一 216-1 ， 占 用 2 个 字 节 。 

>u32， 数 值 范围 为 0 一 23“- 工 ， 占 用 4 个 字 节 。 

>u64， 数 值 范 围 为 0~264-1 ， 占 用 8 个 字 节 ， 

二 u128， 数 值 范 围 为 0~2128-1 ， 占 用 16 个 字 节 ，。 

从 号 整数 包括 : 

>>i8， 数 值 范围 为 -2 ~2 -1 ， 占 用 1 个 字 节 。 

二 i16， 数 值 范 围 为 -215 一 215-1 ， 占 用 2 个 字 节 。 

>i32， 数 值 范围 为 -231 一 231-1 ， 占 用 4 个 字 节 。 

>i64， 数 值 范围 为 -263 ~263-1+ ， 占 用 8 个 字 节 。 

>i128， 数 值 范围 为 -2127 一 2127-1 ， 占 用 16 个 字 节 。 

` 动态 大 小 类 型 分 为 : 

>usize， 数 值 范围 为 0 一 23“-1 或 0~264-1 ， 占 用 4 个 或 8 个 字 节 ， 
具体 取决 于 机 器 的 字 长 。 

>isize， 数 值 范围 为 -231 ~291-1 或 -263 ~703-1 ， 占 用 4 个 或 8 个 字 
三， 同样 取决 于 机 器 的 字 长 。 

浮 点 数 类 型 分 为 : 

二 f32， 早 精度 32 位 浮 点 数 ， 至 少 6 位 有 效 数 字 ， 数 值 围 
为 -3.4x1038 ~3.4x10°8 。 

二 f64， 早 精度 64 位 浮 点 数 ， 人 至 少 15 位 有 效 数 字 ， 数 值 范 围 
为 -1.8x10308 一 1.8x10308 。 

基本 数字 类 型 的 示例 如 代码 清单 2-25 所 示 。 

代码 清单 2-25: 基本 数字 类 型 示例 


L En Mie ()} { 

2 let num = 42u32; 

3 let num: u32 = 42; 

4. let num = Ox2A; // TH 

oF let num = 00106; // Awl 

6 let num = 0b1101 1011; // ZH 

7 assert eq! (b'*', 42u8); // 字 节 字面 量 
8 assert eq! (b'\'', 39u8); 

9. let num = 3.1415926f64; 


LO assert egi (73al4; 32:1464); 

Lia Ber eg. (Za; 200564) 7 

LZ. assert eqi(2e4d, 2ZO000T64) ; 

slate penne (Tr: r sie sekoZ os LAP LN) S 

Lav. BTN ins i Sat roar i NEG INEPUINTTY) J 
Le Bracing ("Listes Bit ez bs 

LE- DELACLES (= Tse", SEAZA MIN} } 

Lig 总 

Lew 3} 


代码 清单 2-25 中 创建 的 数字 字面 量 后 面 可 以 直接 使 用 类 型 后 级 ， 比 
如 42u32， 代 表 这 是 一 个 u32 类 型 。 如 果 不 加 后 缀 或 者 没有 指定 类 型 ， 
Rust 编 译 器 会 默认 推断 数字 为 132 类 型 。 

可 以 用 前 级 0x、0o 和 和 0b 分别 表 示 十 六 进 制 、 八 进 制 和 二 进 制 类 型 。 
比如 0x2A、00106、0b1101 1011. 

Rust 中 也 可 以 写字 节 字 面 量 ， 比 如 以 b 开 头 的 字符 b' *′， 它 实际 
等 价 于 42u8。 

浮 点 数 同 样 也 可 以 为 字面 量 加 类 型 后 级 。 如 果 不 加 后 级 或 没有 指定 
类 型 ，Rust 会 默认 推断 浮 点 数 为 f64 类 型 。 标 准 库 std: : £32 和 std: 
f64 都 提供 了 IEEE 所 需 的 特殊 常量 值 ， 比 如 INFINITY CEKA) 、 
NEG INFINITY (AAK) ~ NAN ( 非 数 字 值 ) ~ MIN (最 小 有 限 
值 ) 和 MAX (最 大 有 限 值 ) 。 


2.6.3 字符 类 型 


在 Rust 中 ， 使 用 单 引号 来 定义 字符 (Char) 类 型 。 字 符 类 型 代表 有 的 
是 一 个 Unicode 标 量 值 ”， 每 个 字符 占 4 个 子 市 ， 子 从 类 型 的 示例 如 代 但 
清单 2-26 所 示 。 

代码 清单 2-26: 字符 类 型 示例 


1 En main({) { 
2 let x = 'r'; 
3 let x = 'U'; 
4 Pe re i Li Ty y 
aN Te E r Fyra 
6 Pee Li (PCB, T 
7 primate fra). ae) g 
8 Princ ay "SDa 
9. assert eq! ('\xZA", ‘"*"'); 
LO. assert eq! (YRZ; a"); 
a Aa assert eg! ('\u{CAO}', 'S'); 
12. ASSSrE colt eat leler. ta) 3 
Lay assert eg! ("s" as £0, 37); 
14. assert eq!('O' as i8, -96); 


Lew, | 


在 代码 清单 2-26 中 ， 使 用 了 多 个 Unicode 值 来 定义 字符 ， 比 如 ”TU 
(、 “如 ' 、”*/ 等 。 同 时 ，Rust 的 字符 也 支持 转 义 符 ， 如 代码 第 4 行 
到 第 8 行 所 示 。 

字符 也 可 以 使 用 ASCII 取 和 Unicode 人 三 来 定义 ， ”2A”′ 为 ASCII 权 表 
HAN APS! *#*′ 的 十 六 进 制 数 ， 格 去 为 ” \XHH”。 ”151”′” 是 Unicode 
十 六 进 制 码 ， 格 式 为 ”NufHHH}”′， 如 代码 第 9 行 到 第 12 行 所 示 。 

同样 ， 可 以 使 用 as 操作 符 将 字符 转 为 数字 类 型 。 ”9%“′ 的 十 进 制 
ASCII 值 是 37。 ' BO! 转换 为 让 ， 该 字符 值 的 高 位 会 被 截断 ， 最 终 得 
到 -96。 


2.6.4 数组 类 型 


数组 (Array) 征 Rust 门 建 的 原始 集合 类 型 ， 数 组 的 特 氮 为 : 


数组 大 小 固定 。 
TERA IRA 
RUA AY 2B. 
数组 的 类 型 签名 为 [T; N] 。TI 是 一 个 泛 型 标记 ， 后 面 会 具体 介绍 ， 
它 代表 数组 中 元 素 的 某 个 具体 类 型 。N 代 表 数 组 的 长 度 ， 是 一 个 编译 时 
音量 ， 必 须 在 编 详 时 确定 其 值 。 数 组 类 型 的 示例 如 代码 清单 2-27 所 示 。 
代码 清单 2-27: 数组 类 型 示例 
i) fn main() { 
2 let arr: Lisa al = [ls By sly 
3 Let mut MUC arr = [Ir 2; 3]; 
4 assert egi (1, mut arr[0]); 
P mut arr[U] = 3; 
6 aSSert 69! (3, Mut arrid]? 
7 let init, are = [07 10]7 
8 assert eq! (0, init _arr[5]); 
2 assert eq! (10, anit arr.ten()); 
1G. ff otanclo (teri se arrlolis J¢ Errore Indes out ot bounds 
bl ee 


在 代码 清单 2-27 中 ， 定 义 了 类 型 为 [i32; 3] 的 数组 ， 访 数组 是 固定 
长 度 的 ， 不 允许 对 其 添加 或 删除 元 了 叉 。 即 使 通过 let _ mut 关键 字 定 义 可 变 
绑 定 mut_arr， 也 只 能 修改 已 存在 于 索引 位 上 的 元 素 。 

另外 ， 还 可 以 通过 [0; 10] 这 样 的 语法 创建 初始 值 为 0 且 指 定 长 度 为 
10 的 数组 。 对 于 越界 访问 的 情况 ，Rust 会 报 编 译 错 误 ， 有 效 阻 止 了 内 存 
不 安全 的 操作 ， 如 代码 第 10 行 所 示 。 

对 于 原始 国定 长 度数 组 ， 只 有 实现 Copy ”trait 的 类 型 才能 作为 其 元 
系 ， 也 就 是 说 ， 只 有 可 以 在 栈 上 存放 的 元 系 才 可 以 存放 在 该 类 型 的 数组 
中 。 不 过 ， 在 不 远 的 将 来 ，Rust 还 将 文 持 VLA (variable-length 
array) 数组 ， 即 可 变 长 度数 组 。 对 于 可 变 长 度数 组 ， 将 会 基于 可 以 在 
栈 上 动态 分 配 内 存 的 函数 来 实现 。 在 本 书写 作 时 ， 文 持 该 功能 的 
Unsized Rvalues 特 性 LU 已 经 被 实现 了 一 小 部 分 。 


2.6.5 范围 类 型 

Rust A J YUE] (Range) H, BSAA 和 全 闭 两 种 区 
A), YASS AY A AN el RAS is 2-28 ATR - 

代码 清单 2-28: 范围 类 型 示例 


il fn main() { 

2 assert €q!((le.0), Stan opsi Rangel, starts Jy ends 3 jllg 
3 assert Sq lear Std: fopss:RangeInelusive:enew(1, 5)}7 
- et Sgi or (4:06) eeu)? 

Di BSErt SG: (orot p (3...=6) .Stim() ) } 

6 fom r am tliwd) 4 

7 rinkln iti", te Jy ly 2, oe 

8 } 

9, for 1. TA {1..—5) | 

ti paired ("T Ey A Iydi Oey © 

Le } 

J ] 


代码 清单 2-28 中 展示 了 两 种 范围 区 间 。 (1..5〉 表示 左 团 右 开 区 
H, (1..=5) 则 表示 全 闭 区 间 。 它 们 分 别 是 std: : ops: : Range 和 
std: : ops: : RangeInclusive 的 实例 。 

范围 自 带 了 一 些 方法 ， 比 如 sum， 可 以 为 范围 中 的 元 素 进行 求 和 。 
并 且 每 个 范围 都 古 一 个 从 代 器 ， 可 以 直接 使 用 for 人 循环 进行 打印 。 请 注意 
两 种 区 间 的 不 同 。 


2.6.6 YJ F RAI 


切片 〈Slice) 类 型 是 对 一 个 数组 〈 包 括 固 定 大 小 数组 和 动态 数组 ) 
的 引用 片段 ， 有 利于 安全 有 效 地 访问 数组 的 一 部 分 ， 而 不 需要 拷贝 。 
为 理论 上 讲 ， 切 片 引 用 的 是 已 经 存在 的 变量 。 在 确 层 ， 切 厂 代 表 一 个 指 
向 数组 起 始 位 置 的 指针 和 数组 长 度 。 用 [T] 类 型 表示 连续 序列 ， 那 么 切 
片 类 型 就 是 &[T] 和 &mut [T]. 

切片 类 型 的 示例 如 代码 清单 2-29 所 示 。 


代码 清单 2-29: 切片 类 型 示例 


1. fn main() { 

Z e lee arre [lisz Bl = Lle Ze óp Se Jl? 
3 assert. Sq! (carr, @&[1, 2,3,4,3)]);7 

4 assert eg! (¢arr[l..«], [4,3,4;9]) 4 

3 assert eq! (¢arr,len()s, Go 

6. aeSert Si! (Garr: Gmpry();, TaLe] 
7 lèt arr = Gmut [1, 2, 3]; 

5 本国 

> assert Sq! tarr; Silly fy al): 

Ls LEC War = Wy lien ee 3) 

Lis Assert Ba (ever [awl [la] 

l2. | 


在 代码 清单 2-29 中 ， 通 过 引用 操作 人 符 & 对 数组 进行 引用 ， 融 产生 了 
一 个 切片 &arr。 也 可 以 结合 范围 对 数组 进行 切割 ， 比 如 &arr[1..]， 表 示 
获取 arr 数 组 中 在 索引 位 置 1 之 后 的 所 有 元 叉 。 

切片 也 提供 了 两 个 const fn 方法 ，len 和 is_empty， 分 别 用 来 得 到 切片 
的 长 上 度 和 判断 切片 是 否 为 空 。 

通过 &mut 可 以 定义 可 变 切 片 ， 这 样 可 以 直接 通过 索引 来 修改 相应 
位 置 的 值 ， 如 代码 第 7 行 到 第 9 行 所 示 。 

对 于 使 用 vec! 宏 定 义 的 动态 数组 ， 也 可 以 通过 引用 操作 符 来 得 到 
一 个 切片 ， 如 代码 第 10 行 和 第 11 行 所 示 。 


2.6.7 str fF FB ZR AY 


Rust 提 供 了 原始 的 字符 串 类 型 str， 也 叫 作 字符 囊 切片 。 它 通常 以 不 
可 变 借用 的 形式 存在 ， 即 &str。 出 于 内 存 安全 的 考虑 ，Rust 将 字符 串 分 
为 两 种 类 型 ”， 一 种 是 固定 长 度 字符 串 ， 不 可 随便 更 改 其 长 度 ， 就 是 st 
字符 串 ， 另 一 种 是 可 增长 字符 串 ， 可 以 随意 改变 其 长 度 ， 就 是 String 字 
符 串 。str 字 符 串 的 示例 如 代码 清单 2-30 所 示 。 

代码 清单 230， str 字 符 串 示例 


ij fn main() { 

2 let truth: &'static str = "Rust £-KRBEWHBE": 

3 at Br = Terie BCE Th? 

4 let len = truth.len(); 

im assert eq! (26, len); 

6 let s = unsafe { 

q let slice = stdsi:slice::irom raw parts (ptr; len); 
8 Doni ron UELS (lice) 

9. by 

LU 4 assert egi (sy Ok(truth)); 


代码 清单 2-30 中 定义 了 字符 串 字 面 量 truth。 本 质 上 ， 了 字符 串 字 面 量 
也 属于 str 类 型 ， 只 不 过 它 是 静态 生命 周期 字符 串 &&”static str 。 上 所 请 静 
仿生 命 周 期 ， 可 以 理解 为 该 类 型 字符 串 和 程序 代码 一 样 是 持续 有 效 的 。 

str 字 符 串 类 型 由 两 部 分 组 成 : 指 同 字符 串 序 列 的 指针 和 记录 长 度 的 
值 。 可 以 通过 str 模 块 提 供 的 as_ptr 和 ]len 方 法 分 别 求 得 指针 和 长 度 ， 如 代 
但 第 3 行 和 第 4 行 所 示 。 

Rust 中 的 字符 串 本 质 上 是 一 段 有 效 的 UTF8 字 市 序列 。 所 以 ， 可 以 
将 一 段 字 市 序列 转换 为 str 字 和 从 串 。 如 代码 第 6 行 到 第 9 行 所 示 。 通 过 调用 
std: : slice: : from_raw_parts 函 数 ， 传 入 指针 和 长 度 ， 可 以 将 相应 的 
字 节 序列 转换 为 切片 类 型 &ru8]。 然 后 再 使 用 std: : str: : from_utf8ps 
数 将 得 到 的 切片 转换 为 str 字符 串 。 因 为 整个 过 程 并 没有 验证 字 节 序列 
是 否 为 合法 的 UTF8 字 符 串 ， 所 以 需要 放 到 unsafe 块 中 执行 整个 转换 过 
程 。 如 条 开 肥 者 看 到 unsafe 块 ， 束 意味 看 Rust 编 详 需 将 内 存 安 全 交 由 开 
及 者 目 行 负 贡 了。 关于 unsafe 块 的 更 多 细 季 ， 将 在 第 13 章 许 细 曾 述 。 


2.6.8 原生 指针 


我 们 将 可 以 表示 内 存 地 址 的 类 型 称 为 指针 。Rust 提供 了 多 种 类 型 
的 指针 ， 包 括 引 用 CReference) 、 原 生 指 针 (Raw Pointer) ~ KGR Er 
(fn Pointer) 和 售 能 指针 (Smart Pointer) 。 

我 们 在 前 面 介 绍 过 引用 ， 它 本 质 上 是 一 种 非 空 指 针 。Rust 可 以 划分 
为 Safe Rust 和 Unsafe Rust 两 部 分 ， 引 用 主要 应 用 于 Safe Rust 中 。 在 Safe 
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原生 指针 主要 用 于 Unsafe Rust 中 。 下 接 使 用 原生 指针 是 不 安全 的 ， 
比如 原生 指针 可 能 指 问 一 个 Null， 或 者 一 个 已 经 被 释放 的 内 存 区 域 ， 
为 使 用 原生 指针 的 地 方 不 在 Safe Rust 的 可 控 范 围 内 ， 所 以 需要 程序 员 自 
己 保 证 安全 。Rnust 文 持 两 种 原生 指针 : 不 可 变 原 生 指 针 *const THAJ 
原生 指针 *mnut T. 

原生 指针 的 示例 如 代码 清单 2-31 所 示 。 

代码 清单 2-31:， 原生 指针 示例 


= fn maing) 

Za let mut x = 10; 

Dn let per x = mil X as "MOE 132; 
4. let y = Box::new(20); 

Sa let ptr y = &*y as *const 132; 
Da unsafe { 

Ta *BtrE X += *ptr yj 

Bis } 

Ds assert eq! (x, 30); 

los J 


在 代码 清单 2-31 中 ， 通 过 as 操作 符 将 &mut x 可 变 引 用 转换 为 smnut 
i32 可 变 原 生 指 针 ptr_x， 如 代码 第 2 行 和 第 3 行 所 示 。 

代码 第 4 行使 用 Box: : new (20) 代表 在 堆 内 存 上 存储 数字 20。 人 然 
后 通过 一 系列 操作 转 成 不 可 变 原 生 指 针 ptr_y。 

然后 对 ptr_x 和 ptr_y 指 针 解 引用 ， 并 将 两 个 指针 指 癌 的 值 求 和 和 ， 最 
终 得 到 30。 如 代码 第 6 行 到 第 8 行 所 示 ， 注 意 操 作 原 生 指 针 要 使 用 unsafe 
块 。 

关于 原生 指针 的 更 多 内 容 ， 在 第 13 间 中 有 详细 阐述 。 


2.6.9 never 类 型 


Rust 中 提供 了 一 种 特殊 数据 类 型 ，never 类 型 ， 即 ! 。 该 类 型 用 于 表 
示 水 远 不 可 能 有 返回 值 的 计算 类 型 ” ， 比 如 线程 退出 的 时 候 ， 束 不 可 能 


有 返回 值 。Rust 是 一 个 类 型 安全 的 语言 ， 所 以 也 需要 将 这 种 情况 纳入 类 
型 系统 中 进行 统一 管理 。 

never 关 型 的 示例 如 代码 清单 2-32 所 示 。 

代码 清单 2-32: neiier 类 型 示例 


l. #![feature (never type) ] 

+ fn foo() -> u32 { 

Ss let x: ! = { 

4. return 123 

Fa be 

6. } 

7. fn main() { 

Oa let num: Option<u32> = Some (42) ; 
9. match num { 

10. Some (num) => num, 

s iaia i None => panic! ("Nothing!"), 
Ls Ke 

lay J 


FEAR 2-327 EH Y +t! [feature (never_type) ] 特 性 ， 这 是 因 
为 当前 never 类 型 属于 实验 特性 ， 所 以 必须 在 Nightly 版 本 下 使 用 该 特 
性 ， 才 可 以 显 式 地 使 用 never 类 型 。 

代 公 第 2 行 到 第 6 行 定义 了 了 foo 函数 ， 其 内 部 定义 的 绑 定 x 指定 J never 
类 型 ， 石 侧 块 中 使 用 了 returmn 表 达 式 。 因 为 return 表 达 式 会 将 123 返 回 ， 
绑 定 x 永远 都 不 会 被 赋值 ， 所 以 这 里 使 用 never 类 型 不 会 出 现 编译 错误 。 
与 returmn 表 达 式 类 似 的 未 有 break 和 continue。 

在 main 国 数 中 使 用 了 match 匹 配 表 达 式 ， 注 意 其 中 None 分 文 使 用 了 
panic! 宏 。 因 为 match 表 达 式 要 求 所 有 的 分 支部 必须 返回 相同 的 类 型 ， 
这 里 panic! 宏 其 实 是 会 返回 never 类 型 ! 的 ， 而 Some (num) 分 支 会 返 
四 u32 攻 型。 为 什么 编 详 硕 没 有 报销 呢 ? 这 是 因为 never 类 型 是 可 以 强制 
转换 为 其 他 任何 类 型 的 。 


2.7 52 BG 


Rust 提 供 了 4 种 复合 数据 类 型 ， 分 别 是 : 

“元 组 (Tuple) 

结构 体 (Struct) 

SASS (Enum) 

` 联合 体 (Union) 

这 4 种 数据 类 型 部 是 寞 构 数 据 结 构 ， 意 味 看 可 以 使 用 它们 将 多 种 类 
型 构建 为 统一 的 数据 类 型 。 本 章 只 介绍 前 3 种 复合 数据 类 型 ， 联 合体 将 
在 第 7 章 介绍 。 


2.7.1 元 组 


元 组 〈Tuple) 是 一 种 异 构 有 限 序 列 ， 形 如 (CT, U, M, N). Pr 
谓 异 构 ， 就 是 指 元 组 内 的 元 素 可 以 是 不 同类 型 的 ， 所 谓 有 限 ， 是 指 元 组 
有 固定 的 长 度 ， 如 代码 清单 2-33 所 示 。 

代码 清单 2-33: 元 组 示例 

te EM MOVe Coords( Xr 1132y L32) J => (ise, 2327) 1 

en (sola F ky Sek P ahd 

Se ft 


4. fn main() { 

5 Let tuple = (&'statsc str, raz, char) = (“hello", 5, "ej 
6. ASSET So (top Be “Hel le"); 

7 ASSerL BO) (TIBLE 1p 27% 

8 assert eg: (tuplé.2, "OJy 

9 let coords = (Wy d)? 


LU let result = move coords (coords) ; 
ee assert, Bos LS the 2))7 

Te let (x, y) = move coords (coords) ; 
L3. assert eq: (x, 1); 

14. assert eq! (yy 2) 

i 


在 代码 清单 2-33 中 ， 定 义 了 次 型 为 〈(& 4 static str, i32, char) 的 元 
组 tuple。 可 以 通过 索引 “来 获取 元 组 内 元 素 的 值 ， 如 代码 第 6 行 到 第 8 行 
所 示 。 

利用 元 组 也 可 以 让 孙 数 返回 多 个 值 ， 如 代码 第 1 行 到 第 3 行 函 数 
move_coordsH xe X ATAN -o 

Al Aletsz fp test VObc, PULA AFAR AAR 7028, BRAS 1 277 F 
1447 Aran. pki ztmove_coordsiX |Hl—~S702ZH, Milet, JEG 
组 第 一 位 会 绑 定 给 x， 第 二 位 会 绑 定 给 y。 之 后 残 可 以 直接 使 用 x 和 y。 

当 元 组 中 只 有 一 个 值 的 时 候 ， 需 要 加 带 写 ， 妈 (0，) ， 这 是 为 了 
和 括 写 中 的 其 他 值 进行 区 分 ， 其 他 值 形 如 (0) o KEERT H KA 
讲 到 的 日 元 类 型 就 是 一 个 空 元 组 ， 即 O 。 


2.7.2 结构 体 


Rust 提 供 三 种 结构 体 : 

“ 具名 结构 体 (Named-Field Struct) 

: 元 组 结构 体 〈Tuple-Like Struct) 

: 单元 结构 体 (Unit-Like Struct) 

上 其 名 结构 体 是 最 单 见 的 结构 体 ， 如 代码 清单 2-34 所 示 。 
代码 清单 2-34: 其 名 结构 体 示 例 


1. #{[derive (Debug, PartialEq) ] 

2. struct People { 

3% iame! &" Stacie Scr, 

4. gender: u32, 

Sa 3 

6. impl People { 

Ta fn new(name: &'static str, gender: u32) -> Self{ 
sP return People{name: name, gender: gender}; 
P } 

LAG a fn name(&self) { 

d Kai OE printlin! ("name: {:?}", self.name) ; 

Le } 

LS o fn set name(smut self, mame: &'static str) 1 
14. self.name = name; 

13 i } 


Lb fn gender (&self) { 


ive let gender = if (self.gender == 1) {"boy"} else {"girl"}; 
18, printlin! ("gender: {:?}", gender); 

19, } 

i + 


hig 2-34 iw struct BEE X 2a People, HERZ 
Re AZ PREETI Gel sae UW. EA AN FR SE Me i A tH BY DA n 
详 ， 但 是 编译 器 会 警告 你 : should have a camel case name. 

结构 体 里 面 字 段 格式 为 name: type，name 是 字段 的 名 称 ，type 古 此 
字段 的 类 型 ， 所 以 称 此 次 结构 体 为 具名 结构 体 。 结 构 体 中 字段 默认 不 可 
弯 ， 而 且 字 段 可 以 是 任意 类 型 的 ， 甚 至 是 结构 体 本 号 。 

People 结 构 体 上 方 的 ##[derive (Debug, PartialEq) ] 是 属性 ， 可 
以 让 结构 体 自动 实现 Debug trait 和 PartialEq trait， 它 们 的 功能 是 允许 对 结 
构 体 实例 进行 打印 和 比较 。 

在 impl People{...} 块 中 为 People 结 构 体 实现 了 4 个 方法 ，new、 
name. set_name 和 gender。 
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数 ， 就 是 自由 函数 。 而 在 impl 块 中 定义 的 函数 被 称 为 方法 ， 这 和 面向 
对 象 有 点 渊源 。 从 代码 清单 2-34 中 可 以 看 出 来 ，name 和 gender 函 数 的 定 
义 中 有 一 个 参数 &self， 它 代表 一 个 对 结构 体 实 例 自身 的 引用 ， 这 样 方 
便 我 们 使 用 圆 点 记号 来 调用 结构 体 实例 中 定义 的 相关 函数 ， 如 代码 清单 
2-35 所 示 。 

代码 清单 2-35: 用 圆 点 记号 调用 结构 体 实例 中 定义 的 相关 函数 


il fn natni 

2 let alex = People::new( "Alex", 1); 

3 alex.name () ; 

1 alex.gender (); 

J, assert egi (alex; People i name; “Alex”, gender: 1 j)7 
6 let mut alice = People::new("Alice", 0); 

i alice.name(); 

8 alice.gender(); 

9 assert eq! (alice, People { name: "Alice", gender: 0 }); 
th alice.set name ("Rose"); 

fa A alice.name(); 

ee assert eg! (alice, People { name: "Rose", gender: U |); 
i | 


在 代码 清单 2-35 中 ， 通 过 People: : new 方 法 来 创建 People 结构 体 实 
例 alexz。 并 且 可 以 通过 圆 点 记 亏 来 调用 结构 体 中 的 函 数 name 和 gender。 
代码 第 3 行 和 第 4 行 的 写法 完全 符合 面 问 对 象 销 恩 通 信和 模型 
receiver.message。 所 以 说 ，Rust 具 名 结构 体 是 面 同 对 象 思想 的 一 种 体现 


所 以 ， 这 里 实现 的 name 和 set name 两 个 方 读 ， 有 点 类 似 于 面 癌 对 象 
中 的 getter 和 setter 方 法 ， 这 两 个 方法 的 作用 束 古 获取 和 修改 成 员 和 变量 的 
具体 值 。 注 意 这 两 个 方法 签名 中 的 &seff 和 &mut self 的 用 法 。 结 构 体 中 
定义 的 new 方 法 ， 则 类 似 于 面 同 对 象 语 言 中 类 的 构造 函数 ， 但 实际 上 
Rust 中 并 没有 构造 函数 。 注 意 new 方 法 参数 并 没有 &self， 在 调用 new 方 
法 的 时 候 和 直接 使 用 了 一 对 冒号 ， 而 不 是 圆 点 记号 。 

除了 具名 结构 体 ，Rust 中 还 有 一 种 结构 体 ， 它 看 起 来 像 元 组 和 具名 
结构 体 的 混合 体 ， 叫 元 组 结构 体 ”， 如 代码 清单 2-36 所 示 。 其 特点 是 ， 


字段 没有 和 名称 ， 只 
代码 清单 2-36: 元 组 结构 体 示 例 


站 二 二 站 二 COLO (laap 122; 1352)? 
fn main() { 


= OO & GW N F&F 


} 


ARE 。 


let color = Color(Q, y 2% 


1 
assert eq! {colors.0, OU); 
) = 
) 


r 


0 
assert eg: (calor.dy, 4 
2 


r 


assert Eg! (color.2, 


代码 清单 2-36 中 定义 了 元 组 结构 体 Color， 看 上 去 束 像 其 名 的 元 组 。 
注 症 ， 元 组 结构 体 后 面 要 加 分 号。 元 组 结构 体 访 问 字 上 段 的 方式 和 元 组 一 
样 ， 也 是 使 用 圆 点 记号 按 位 置 索 引 访 问 。 

当 一 个 元 组 结构 体 只 有 一 个 字段 的 时 候 ， 我 们 称 之 为 New Type 模 
式 ， 如 代码 清单 2-37 所 示 。 

代码 清单 2-37: New Type 模式 示例 


Ls 


own OF e W ND 


Struct Integer (u32); 

type Int = 132; 

fn main () { 
let int = Integer(10); 
assert eq! (ant.0, 10); 
let int: Int = 10; 
assert eq! (int, 10); 


} 


代码 清单 2-37 中 定义 了 integer 单字 段 结构 体 ， 字 段 为 u32 类 型 。 之 所 
以 称 为 New Type 模式 ， 是 因为 相当 于 把 u32 类 型 包装 成 了 新 的 Integer 类 


I 
A o 


也 可 以 使 用 type 关 键 字 为 一 个 类 型 创建 别名 ， 如 代码 第 2 行为 132 类 
型 创建 了 一 个 别名 Int， 但 是 其 本 质 还 是 i32 类 型 ， 它 所 拥有 的 行为 和 i32 
是 一 样 的 。 相 比 之 下 ，New Type 模式 属于 自 定义 类 型 ， 更 加 灵活 。 

Rust 中 可 以 定义 一 个 没有 任何 字段 的 结构 体 ， 即 单元 结构 体 ， 如 代 


但 清单 2-38 所 示 。 


Sis 2-38: 单元 结构 体 示 例 


1 struct Empty; 

2 fn main() { 

3 let x = Empty; 

4. DELHI AE ("1 fe", ERK)? 

3 let y = x; 

6 La ("i see", el 

7 let z = Empty; 

0 DEIN 4 "y Ses 

Da assert. Col js STA TODS i tRangerull) ; 


LO. } 

代码 清单 2-38 中 定义 了 Empty 结构 体 ， 等 价 于 struct Empty{}。 音 元 
结构 体 实 例 吏 是 其 本 喘 。 也 许 有 的 人 会 有 疑问 : 为 同一 个 单元 结构 体 创 
建 多 个 实例 ， 这 些 实例 是 否 是 同一 个 对 象 ? 注意 ， 此 处 的 “对 象 " 是 广义 
层面 的 ， 并 非特 指 面 同 对 象 中 的 “对 象 ”。 

代码 第 5 行将 X 赋 值 给 新 的 绑 定 y。 此 时 因为 x 是 位 置 表达 式 ， 而 它 的 
上 下 文 是 值 上 和 下文， 所 以 它 的 内 存 地 址 会 移动 给 新 的 位 置 表达 式 y。 

代码 第 7 行 定 义 了 新 的 绑 定 z， 将 新 的 单元 结构 体 实例 贱 子 了 z。 

然后 通过 {: p} 格 式 符 在 printmn! 宏 语句 中 打印 &x、&y 和 &z 的 内 存 
地 址 ， 会 发 现 以 下 事实 : 

在 Debug 编 译 模式 下 ，x、y 和 z 是 不 同 的 内 存 地 址 。 

在 Release 编 译 模式 下 ，x、y 和 z 是 相同 的 内 存 地 址 。 

这 证 明 ， 在 Release 编译 模式 下 ， 蛙 元 结构 体 实例 会 补 优 化 为 同一 
个 对 象 。 而 在 Debug 模 式 下 ， 则 不 会 进行 这 样 的 优化 。 

单元 结构 体 与 New Type 模 式 类 似 ， 也 相当 于 定义 了 一 个 狐 的 类 型 。 
蛙 元 结构 体 一 般 用 于 一 些 特定 场景 ， 标 准 库 中 表示 全 泡 围 (..) 的 
RangeFull， 就 是 一 个 单元 结构 体 ， 如 代码 第 9 行 上 所 示 。 


2.7.3 枚 举 体 


枚 举 体 〈Enum， 也 可 称 为 枚 举 类 型 或 枚 举 ) ， 顾 名 思 义 ， 诅 闫 型 
包含 了 全 部 可 能 的 情况 ， 可 以 有 效 地 防止 用 户 提 供 无 效 值 。 在 Rust 中 ， 


枚 举 类 型 可 以 使 用 enum 关 键 子 来 定义 ， 并 且 有 三 种 形式 ， 其 中 一 种 是 
无 参数 枚 举 体 ， 如 代 人 码 消 早 2-39 所 示 。 
代码 清单 2-39: 无 参数 枚 举 体 示 例 


Bs enum Number { 

Ze Zero, 

Ja One, 

4. Two, 

Se =) 

6 fin main) | 

Ta let a = Number::One; 

0. match a { 

9 . Number::Zero => printin! ("0"), 
10. Number::One => println! ("1"), 
Lis Number::Two => printlin! ("2"), 
2. } 

13. | 


代码 清单 2-39 中 定义 了 枚 举 体 Number， 包 含 了 三 个 值 Zero、One 和 
Two。 和 需要 注意 ， 这 三 个 是 值 ， 而 非 类 型 。 

在 main 印 数 中 ， 息 要 使 用 枚 举 体 的 值 ， 需 要 使 用 Number 亲 缀 ， 如 
代码 第 7 行 所 示 。 可 以 使 用 match 死 配 来 枚 举 所 有 的 值 ， 以 处 理 相 应 的 情 
Dlo 

Rustt® A) LAS AC BS PARERA, Be EEA 
二 种 形式 的 枚 举 体 ， 我 们 称 之 为 类 C 枚 举 体 ， 如 代码 清单 2-40 所 示 。 
代码 清单 2-40: 类 C 枚 举 体 示例 
enum Color { 

Red = Oxff0000, 

Green = Ox00ff00, 

Blue = Ox0000ff, 

} 


fn main() { 


J QA OF fb WW NHN A 


printlin! ("roses are #{:06x}", Color::Red as 132); 


B. println! ("violets are #{:06x}", Color::Blue as 132); 
> | 


代码 清单 2-40 中 定义 了 枚 举 体 Color， 其 中 包含 了 三 个 枚 举 值 : 
Red、Green 和 Blue， 还 分 别 被 赋予 了 相应 的 值 。 同 样 ， 如 果 要 使 用 具体 
的 枚 举 值 ， 需 要 加 Color 前 组， 如 代码 第 7 行 和 第 8 行 所 示 。 

Rust 还 文 持 携 市 类 型 参数 的 枚 举 体 ， 也 束 是 我 们 要 讲 的 第 三 种 枚 举 
体 ， 如 代码 清单 2-41 所 示 。 

代码 清单 2-41: 市 参数 枚 举 体 示 例 
1 enum IpAddr { 
2 V4(u8, us, us, us), 
3 Vo (String) » 
4 } 

5. Lo main) { 
6 let x : En(ués, us, us, us) => IpAddr = IpAddr: :V4; 

7 let y : fn(String) -> IpAddr = IpAddr::V6; 

8 let home = IpAddr::V4(127, 0, 0, 1); 

2 } 

代码 清单 2-41 中 定义 的 枚 举 体 IpAddr， 其 枚 举 值 携带 了 类 型 参数 。 
这 样 的 枚 举 值 本 质 上 属于 函数 指针 类 型 。 

从 代码 第 6 行 和 第 7 行 中 看 得 出 来 ，IpAddr: : V4zefn (u8, u8, 
u8, u8) -之 IpAddr 函 数 指针 ，IpAddr: : V6 是 fn (String) ->IpAddre& 
TAFT o 

1 FAIRER PRA AE, TPR ASE BS, GOT 
第 8 行 所 示 。 

MAAE Rust 中 属于 非 利 重要 的 闫 型 之 一 。 一 方面 它 为 编程 提供 
了 很 多 方便 ， 另 一 方面 ， 它 保证 了 Rust 中 避免 出 现 空 指针 。 其 应 用 示例 
如 代码 清单 2-42 所 示 。 

代码 清单 2-42: 枚 举 体 应 用 示例 


La enum Option{ 

Zs Some (132), 

Rs None, 

4. } 

S: Ln mart) i 

G. let s = Some (42); 

Fe let num = s.unwrap(); 
O matei = 了 

9. some (n) => printin! (“num is: {}", mi); 
LI, None => (), 

ji F 

Leu 4 


在 代码 清早 2-42 中 定义 了 Option 枚 举 类 型 HEA ZR ENA 
E 和 无 值 两 种 情况 。 其 中 Some (i32) 代表 有 i32 类 型 的 值 ， 而 None 代 
表 无 任何 值 。 

该 类 型 可 以 作为 菜 些 函数 的 返回 值 。 如 果 函 数 有 合法 的 值 返 回 ， 则 
使 用 Some (i32) MSA; 如 果 困 数 要 返回 空 ， 则 可 以 使 用 None。 这 样 
一 来 ， 访 函数 的 值 束 确定 了 ， 无 非 就 是 两 种 ， 有 值 或 无 值 。 调 用 该 函 数 
的 开发 者 束 可 以 分 别处 理 这 两 种 情况 ， 从 而 提升 程序 的 健壮 性 。 

企 main 函 数 中 ， 定 义 了 绑 定 s 的 值 为 Some (42) 。 因 为 这 里 的 值 是 
硝 定 的 ， 所 以 可 以 使 用 unwrap 方 法 将 Some (42) 中 的 数字 42 取 出 来 。 
如 果 在 不 人 确定 的 情况 下 使 用 unwrap， 可 能 会 导致 运 行 时 错误 。 我 们 可 以 
使 用 match 匹 配 来 枚 举 这 两 种 情况 ， 并 分 别处 理 ， 如 代码 第 8 行 到 第 11 行 
所 示 。 

这 个 Option 类 型 可 以 有 效 地 避免 开 肥 中 出 现 Null 值 ， 所 以 Rust 标 准 
库 中 也 内 置 了 相应 的 闫 型 ， 只 不 过 它 是 汉 型 的 枚 举 体 Option<T > 之， 如 
代码 清单 2-43 所 示 。 这 样 一 来 ， 开 发 者 无 须 目 己 定义 束 可 以 直接 使 用 沁 
型 的 枚 举 体 了 。 

代码 清单 2-43: Optionn<T> Ail 


fn main () { 
let s: &Option<String> = &Some("hello".to string({)); 
// Rust 2015 版 本 


match s { 


q = (), 
i 
// Rust 2018 版 本 


1 
2 
3 
4 
oe &Some(ref s) => println!("s is: {}", s), 
6 
7 
8 
9 match s { 


10. some (s) => printin! ("s ist {}", s), 
ti, => (); 

I2: } 

Los J 


在 代码 清单 2-43 中 ， 可 以 直接 使 用 Some (T) ，TI 是 泛 型 ， 此 处 基 
体 类 型 为 &str 字 符 串 。 

代码 第 2 行 定义 了 &Option 过 &str 之 拓 型 的 绑 定 s， 这 里 使 用 引用 是 
为 了 泗 示 match 匹 配 的 两 种 写法 。 

代码 第 4 行 到 第 7 行 是 Rust 2015 版 本 中 的 写法 。 在 match 匹 配 分 支 
中 ， 使 用 &Some (ref s) 这 样 的 匹配 模式 是 为 了 解构 &Some C" hello 
" to_string © ) 。 其 中 ref 也 是 一 种 模式 岂 配 ， 是 为 了 解构 &Some (ref 
s) 中 s 的 引用 ， 避 人 免 其 中 的 s 人 被 转移 了 所有权。 

代码 第 9 行 到 第 12 行 是 Rust 2018 版 本 中 的 写法 。 目 的 和 第 4 行 到 第 7 
行 相同 ， 但 是 不 雷 要 再 使 用 引用 操作 符 和 ref 来 进行 解构 了 。 在 新 的 版 本 
中 ，match 匹 配 会 目 动 处 理 这 种 情况 。 


As El A 


2.8 常用 集合 类 型 


在 Rust 标 准 库 std: : collections 模 块 下 有 4 种 通用 集合 类 型 ， 分 别 如 


下 。 


线性 序列 : [alse CVec) ~ imij] CVecDeque) 、 和 链表 


(LinkedList) 。 


Key-ValuetRit 4: 无 序 哈 硕 表 (HashMap) . AFREK 


(BTreeMap) . 


. EAKR 


集合 类 型 : 无 序 集 合 (HashSet) — AFTRA (BTreeSet) 。 
` 优先 队列 : = SHE (BinaryHeap) 。 


2.8.1 线性 序列 : HÆ 


可 量 也 是 一 种 数组 ， 和 基本 数据 类 型 中 的 数组 的 区 别 在 于 ， 同 量 可 
动态 增长 。 代 码 清单 2-44 展 示 了 一 个 向 量 的 示例 。 
代码 清单 2-44，Vec<T > 示例 


fn Wain) % 


ju 


OO 0O ~l OH OF & W DO 


=e He H H 
W N Be O» 


14. 


} 


let mut vl = vec![]; 
vil.push (1) ; 

| eli (2) 5 

VL. pushi) j 
assert. egi (vil, [A231] 7 
assert eg! (vL[1]; 2)» 

let mut v2 = vec![0; 10]; 
let mut v3 = Vec::new(); 
va. push (4) 3 

v3 push (5): 

Vo <push (6) 

// vw3[(4]?: error: index out of bounds 


在 代码 清早 2-44 中 ， 使 用 了 三 种 方法 来 初始 化 同 量 ， 分 别 见 v1、v2 


和 vVv3 的 初始 化 方法 。 回 量 的 用 法 和 一 般 数组 是 类 似 的 ， 但 是 如 果 要 往 辐 
量 中 增加 元 了 系 ， 则 需要 用 mnut 来 创建 可 变 绑 定 。 访 问 元 系 也 是 通过 下 标 
索引 来 访问 的 。 

vec! 是 一 个 宏 ， 用 来 创建 问 量 字面 量 。 宏 语句 可 以 使 用 圆 括 号， 
也 可 以 使 用 中 括号 和 花 插 号 ， 一 般 使 用 中 括号 来 表示 数组 。 可 以 使 用 
push 廊 法 往 同 量 数 组 中 浴 加 新 的 元 系 。 回 量 也 内 置 了 很 多 其 他 方法 ， 在 

第 8 和 章 将 详细 介绍 它们 。 

Rust 对 癌 量 和 数组 都 会 做 越界 检查 ， 以 保证 安全 。 如 代码 第 13 行 所 
示 ， 调 用 v3[4]， 编 详 峰 会 报 panic 销 误 : thread’ main’ panicked at 
index out of bounds. 


2.8.2 RIET YI: vn RA YI 


XM vig BAYI) (Double-ended Queue, 45 NDeque) 是 一 种 同时 具有 队 
列 《 先 进 先 出 ) M Gah) 性质 的 数据 结构 。 双 新 队列 中 的 元 又 
可 以 从 两 端 弹出 ， 插 入 和 删除 操作 被 限定 在 队列 的 两 尊 进 行 。 

Rust 中 的 VecDeque 是 基于 可 增长 的 RingBuffer 算 法 实现 的 双关 队 
列 。 人 代码 清单 2-45 展 示 了 一 个 双 病 队列 的 示例 。 

代码 清单 2-45: VecDeque<T> xf 


1. use std::collections: :VecDeque; 

as OM Wem {) 4 

Ss let mut buf = VecDeque: :new() ; 

4. buf.push front.(.1) ; 

Ds buf. push froent.(2) 7 

a assert Sq! (oureget (0), Some (ez) ); 
Fa Dor eg: (bur.gettl), Gomes (S1)? 
8. Duf. push back (3) ; 

23 buf.push back (4)? 

lUs BUT sie backas 

i hs assert eq! (but.get(z), Some (a3) ); 
Le. assert eq! (Buf.get (3), Some (4) ); 
La assert eq! (buf get (4), Some (to) ) 7 


在 代码 清单 ”2-45 中， 需要 通过 use KES) A std: : 
collections: : VecDeque， 因 为 VecDeque 雪 工 之 并 不 会 像 Vec<T > 那样 
做 目 动 引 入 。 

双 疹 队列 VecDeque 实 现 了 两 种 push 方 法 ， gg front 和 push_ back。 
push_front 的 行为 像 栈 ，push_back 的 行为 像 队 列 。 通 过 get 方 法 加 索引 值 
可 以 获取 队列 中 相应 的 全 。 

代码 第 6 行 和 第 7 行 通 过 push_front 先 后 添加 了 元 素 1 和 2， 但 是 相应 
的 索引 是 1 和 0， 正 是 栈 数据 结构 先进 后 出 的 体现 。 

代码 第 11 行 到 第 13 行 通过 push_back 先 后 添加 了 元 素 3、4 和 5， 相 应 
的 索引 位 置 是 2、3 和 4， 正 是 队列 先进 先 出 的 体现 。 


2.8.3 线性 序列 : 链表 


Rust 提 供 的 链表 是 双 回 链表， 人 允许 在 任意 一 站 插入 或 弹出 元 际 。 但 
是 退 常 最 好 使 用 Vec 或 YecDeque 类 型 ， 因 为 它们 比 链 表 更 加 快速 ， 内 和 存 
访问 效率 更 局， 并且 可 以 更 好 地 利用 CPU 缓存。 


代码 清单 2-46 展 示 了 一 个 链表 的 示例 。 
代码 清单 2-46: LinkedList<T> 7A fil 


1 use std: rcollections: :LinkedList;; 

2 fn main() { 

3 let mut listl = LinkedList: :new(); 

4. li stl eeusn back ("a")? 

5 let mut list2 = LinkedList: :new(); 

6 last2. push DACRE TD]? 

2 list2.push back 人 小 

8. listl.append(&mut list2) ; 

f Brim ln Cees LISTOU A Pane Ty Tgr] 


La 和 

Leb itstl.pop fronb{); 

T2 erin de s Lsp? ye [ets Fe] 

Re P JIL LB Front pT ET] 

14. OPISE Piers, daS gf [ ee, Mas, Ne] 
LBs ligtz2.pusn Frent (* ££"), 

16s | 

Lia | 


在 代码 清单 2-46 中 ， 依 然 使 用 use 显 式 引 入 std:， : collections: 
LinedList。 因 为 古 双 同 列 表 ， 所 以 提供 了 push_back 和 push_front 风 类 方 
法 ， 方 便 操作 此 链表 。 也 提供 了 append 方 法 ， 可 以 用 来 连接 两 个 链表 。 
更 多 相关 的 操作 ， 可 以 但 看 标准 库 文 档 。 


2.8.4 Key-Valuelt i} 7: HashMap 和 BTreeMap 


Rust 集 合 模块 一 共 为 我 们 提供 了 两 个 Key-Value 哈 和 硕 上 映射 表 : 

- HashMap <K,V > 

- BTreeMap< K,V > 

Key 必 须 是 可 哈 希 的 类 型 ，Value 必 须 是 在 编译 期 已 知 大 小 的 类 型 。 
这 两 种 类 型 的 区 别 之 一 是 ，HashMap 是 无 序 的 ，BTreeMap 是 有 序 的 
。 它 们 的 类 型 签名 分 别 是 HashMap<K，V> 和 BTreeMap<K，V>， 如 
代码 清单 2-47 所 示 。 

代码 清单 2-47: HashMap<K, V>AllBTreeMap<K, V> 


i. use std::collections::BTreeMap; 

Z use std::collections: :HashMap; 

3 fn main() { 

4 let mut hmap = HashMap: :new(); 
am let mut bmap = BTreeMap::new(); 
6 mman Anser E ia, ej 

" map. insertii; "a")? 

8 Hina. Laser: (2, “> 

9 hmap.insert(5, "e"); 

LO s inap.inserc(4, “"<a""); 

inh I Em Set lS TETIS 

Le .. bitap.ansere(Z, TB"); 

1.3 bmap.ainesere (ll, va yy 

14. bmap.insert(5, "e"); 

13% bmap.LnSsert (4, a"); 

A ws wsdl wet ta, hmap) ; 

Esd y Deum Ln din map); 

lse d 


EIRIS 2-47 中 , 同样 引入 了 use std: : collections: 
BTreeMap 和 use std: : collections: : HashMap。 通 过 内 置 的 new 方 
法 ， 可 以 创建 相应 的 实例 hmap 和 bmap。 然 后 通过 insert 方 法 插入 键 值 
对 。 

代码 第 16 行 的 hmap 的 输出 结果 为 {1: "a", 2: "b", 3: "c 
", 5: "e", 4: "d"}, 但 key 的 顺 友 是 随机 的 ， 每 次 执行 可 能 会 不 
一 样 ， 因 为 HashMap 是 无 序 的 。 

代码 第 17 行 的 bmap 的 输出 结果 永远 都 是 {1: "a", 2: "b", 3: 
"co", 4: "d", 5: "e"}， 顺 友 不 会 改变 ， 因 为 BTreeMap 是 有 有 到 
的 。 

标准 库 中 还 提供 了 不 少 操作 这 两 种 映射 表 的 方法 ， 可 以 去 文档 中 得 
看 。 在 第 8 章 中 也 会 有 更 详细 的 介绍 


2.8.5 集合 : HashSet 和 BTreeSet 


HashSet<K>#BTreeSet<K> #5272 HashMap<K, V> 


BTreeMap<K, V>#U Value 6 22 7u2H WF EKW, StF HashSet 


<K, 
概 如 下 : 
. 集合 中 的 元 系 应 该 是 唯一 的 ， 因 为 是 Key-Value 英 射 表 的 Key。 
` 同 理 ， 集 合 中 的 元 率 应 该 都 是 可 哈 布 的 类 型 。 
- HashSet 应 该 是 无 序 的 ，BTreeSet 应 该 是 有 序 的 。 
HashSet<K > #llBTreeSet<K> WAN Pil GORA 2-48 AT AR - 
代码 清单 2-48: HashSet<K > fl BTreeSet<K> 7 fil 


() >AlBTreeSet<K, O > 之。 所 以 这 两 种 集合 类 型 的 特性 大 


use std::collections: zHashnsSet: 


1 
Bs use std::collections::BTreeSet; 
3 fn main() { 

4 


let mut hbooks = HashSet::new(); 


n let mut bbooks = BTreeSet::new(); 

0. hbooks.insert("A Song of Ice and Fire"); 

‘ie hbooks.insert ("The Emerald City"); 

8. hbooks.insert ("The Odyssey"); 

9, if !hbooks.contains("The Emerald City") { 

ik printin! ("We have {} books, but The Emerald City ain't one.", 

alex hbooks.len() 

Les ) ; 

15 

14, PELATA: ("1 fF)", books) } 

Lele bbooks.insert("A Song of Ice and Fire"); 

16 bbooks.insert ("The Emerald City"); 

Lhe bbooks.insert ("The Odyssey") ; 

18. printilns (17) bodoks)} 

12. 

在 代码 清单 2-48 中 ， 第 14 行 的 hbooks 内 容 的 输出 顺序 是 随机 的 ， 

为 HashSet 是 无 序 的 。 


第 18 行 的 bbooks 的 输出 顺序 永远 是 {" A Song of Ice and Fire" ， 


The Emerald City", " The Odyssey" }， 因 为 BTreeSet 是 有 序 有 的 。 


2.8.6 优先 队列 : BinaryHeap 


Rust 提 供 的 优先 队列 是 基于 二 又 最 大 堆 (Binary Heap) 实现 的 ， 


如 代码 清单 2-49 所 示 。 


isis 442-49: BinaryHeap<T> zR% 


use std::collections: :BinaryHeap; 


fn main() { 


let mut heap = BinaryHeap: :new() ; 
assert eq! (heap.peek(), None) yg 
Let arr = [93r 80; 46% 33; lay S0y 1b, SG, lör 23; 45l! 
for &1 in arr.iter() { 

heap.push(1i) ; 
} 
assert eq! (heap.peek(), Som (hd): 
i? IB BOr 26, Bay Te; SU, oy 26, 13, Soe 45] 
pYintlnd (AT: 7 Heap); 


在 代码 清单 2-49 中 ， 我 们 使 用 BinaryHeap: : newb € J TRA 


堆 。 使 用 peek 方 法 可 以 取出 堆 中 的 最 大 值 。 在 代码 党 4 行 中 ， 因 为 堆 中 
没有 任何 值 ， 所 以 peek 方 法 取出 的 是 None。 


代码 第 5 行 到 第 8 行 通过 迭 代 将 数组 中 的 元 又 依次 push 到 堆 中 。 然 后 


再 通过 peek 方 法 取出 堆 中 最 大 的 元 系 ， 即 93。 


标准 库 还 提供 了 很 多 操作 BinaryHeap 的 方法 ， 可 以 查看 其 文档 。 


2.9 智能 指针 


智能 指针 (Smart Pointer) 的 功能 并 非 Rust 独 有 的 ， 它 源 目 C++ 语 
言 ，Rust 将 其 引入 ， 并 使 之 成 为 Rust 语 言 中 最 重要 的 一 种 数据 结构 。 

Rust 中 的 值 默 认 被 分 配 到 栈 内 存 。 可 以 通过 Box <T> 将 值 装 箱 
(在 推 内 存 中 分 配 ) ”，。Box<T> 是 指 癌 类 型 为 T 的 堆 内 存 分 配 值 的 智 
能 指针 。 当 Box<T> 超 出 作用 域 范 围 时 ， 将 调用 其 析 构 函数 ， 销 毁 内 
部 对 象 ， 并 目 动 释放 堆 中 的 内 存 。 可 以 通过 解 引 用 操作 符 来 获取 Box<< 
T> FAT. 

看 得 出 来 ，Box 二 TT 二 的 行为 像 引 用 ， 并 且 可 以 目 动 释放 内 存 ， 所 
以 我 们 称 其 为 智能 指针 。 

Rust 中 提供 了 很 多 知 能 指针 类 型 ， 本 章 只 介绍 Box<T> 。 使 用 Box 
<T> 可 以 在 推 内 存 中 分 配 一 个 值 ， 如 代码 清单 2-50 所 示 。 

代码 清单 2-50: Box< 工 > 在 堆 内 存 中 分 配 值 的 示例 


1. fn main() { 

Z # [derive (Partialkq) ] 

Ee struct. Point qf 

4. x? rod, 

oF y: £64, 

6. } 

let. box point = Box:inew(Poant { x: 0.0, yi 0.0 }); 
P let unboxed point: Point = *boxed point; 

T assert eq! (unboxed point, Point { x: 0.0, yz 0.0 }); 
10; } 


在 代码 清单 2-50 中 ， 我 们 在 main 函 数 内 部 定义 了 结构 体 Point， 并 使 
用 Box: : new 方 法 将 其 直接 疤 箱 ， 这 样 它 惑 家 分 配给 了 扒 内 存 。 然 后 
使 用 解 引用 操作 从 将 其 解 引 用 ， 束 可 以 得 到 内 部 的 Point 实 例 。 

通过 Box<=T>， 开 太 痢 可 以 方便 无 痛 地 使 用 堆 内 存 ， 并 且 无 须 手 
工 释 放 扒 内 存 ， 可 以 确保 内 存 安 人 全。 第 5 章 会 介绍 关于 智能 指针 的 更 多 
HT o 


2.10 2 4 M trait 


泛 型 和 trait 是 Rust 类 型 系统 中 最 重要 的 两 个 概念 。 

泛 型 “并 不 是 Rust 特 有 的 概念 ， 在 很 多 强 类 型 编程 语言 中 也 文 持 泛 
型 。 泛 型 允许 开发 者 编写 一 些 在 使 用 时 才 指 定 类 型 的 代码 。 泛 型 ， 顾 名 
思 义 ， 就 是 泛 指 的 类 型 。 我 们 在 日 音 的 编程 中 会 写 一 些 图 数 ， 并 可 能 将 
其 用 在 很 多 类 型 中 。 如 果 为 每 个 类 型 都 实现 一 过 ， 那 么 工作 量 会 成 倍增 
加 。 泛 型 就 是 为 了 解决 这 个 问题 的 ， 可 以 方便 代码 的 复 用 。 

trait 同样 也 不 是 Rust 独 有 的 概念 ， 它 借鉴 了 Haskell 的 Typeclass。 第 
1 草 已 经 介绍 过 ，trait 是 Rust 实 现 零 成 本 抽象 的 基石 ， 它 有 如 下 机 制 : 

trait 是 Rust 唯 一 的 接口 抽象 方式 。 

可 以 静态 生成 ， 也 可 以 动态 调用 。 

可 以 当 作 标记 类 型 拥有 某 些 特定 行为 的 “标签 ”来 使 用 。 

简单 来 说 ，trait 是 对 类 型 行为 的 抽象 。 

2.10.1 泛 型 

Rust 标准 库 中 定义 了 很 多 沁 型 类 型 ， 包 括 Option<T>. Vec<T 
>. HashMap<K, V>ULARBox<T>“. HP ”Option<T>> 就 是 一 种 
典型 的 使 用 了 泛 型 的 类 型 ， 代 码 清单 2-51 展示 了 其 定义 。 

代码 清单 2-51: Option< 工 > 定义 示例 


Ls JZZ Stas septions :Option 
Zs enum Option<T>{ 

E Some (T), 

4. None, 

= 


} 

在 泛 型 的 类 型 倍 名 中 ， 通 第 使 用 字母 T 来 代表 一 个 汉 型 。 也 吏 是 说 
这 个 Option 二 TT 二 枚 淮 类 型 对 于 任何 类 型 都 适用 。 这 样 的 话 ， 我 们 束 没 
必要 给 每 个 类型 都 定义 一 过 Option 枚 举 ， 比 如 Option<u32>=sk Option 
< String 之 等 。 标 准 库 提 供 的 “Option<T> 类 型 已 经 通过 use std: : 


prelude: : vl: : * 上 自动 引入 了 每 个 Rust 包 中 ， 所 以 可 以 直接 使 用 
Some (T) 或 None 来 表示 一 个 Option<T > 类 型 ， 而 不 需要 写 
Option: : Some (T) 或 Option: : None. 

Option<T > 的 应 用 示例 如 代码 清单 2-52 所 示 。 

代码 清单 2-52: Option <T> MH Ri 

l uge std:: fmt: -Debug; 


ea Tn Matti Option<T: Debug>(as Oplion<Ts) í 
3. match o { 

= Sentiy => prantind {n rI P a), 
Sa None => printlin! ("nothing"), 

6s } 

or 

Gs En maim()4 

3 let a: Option<i32> = Some(3); 

Ld let b: Option<éstr> = Some("hello"); 
ie Re let €: Option<char> = Some('‘'A"'); 

ha let d: Option<u32> = None; 

Lee match option(a); // 3 

14. matek option(s); /7 “hello” 

LS matek aptien(c); // TA! 

16. match option(d); // nothing 

Liy a 


在 代码 清 单 2-52 中 ， 定 义 了 match_option 泛 型 函数 ， 此 处 二 T: 
Debug > ÆI% JN Y trait Ik E MZE, Eii, RAKHI Y Debug trait 的 
类 型 才 适 用 。 只 有 实现 了 Debug trait 的 类 型 才 拥 有 使 用 " {: ? }" 格式 
化 打印 的 行为 。 

如 果 去 挥 Debug 限 定 ， 编 详 妖 会 报错 ' T’ cannot be formatted using 
1:2?! ， 这 也 充分 体现 了 Rust 的 类 型 安全 你 证 。 

代码 第 9 行 到 第 12 行 定义 的 a、b、c、d 这 4 个 变量 绑 定 ， 分 别 为 
Option<T> fsx 了 4 种 具体 的 类 型 。Rust 编 详 右 会 在 编译 期 间 目 动 为 这 
ApH ZE AY AE AK Option<i32 >. Option<&str>. Option<char> #llOption 
<u32> 之 这 4 种 具体 的 代码 实现 ， 方 便 开 发 者 直接 使 用 。 


Onn DH  & WwW Bh Fr 


2.10.2 trait 


trait 和 类 型 的 行为 有 关 ，trait 的 示例 如 代码 清单 2-53 所 示 。 
代码 清单 2-53: trait 示 例 
Struce Due: 
SLEDGE PLU; 
Ero Ely f 
tn tly(éselr) -2 bool; 
} 
i i 
fn fly(éself) -> bool 4 


return true; 


} 
impl Fly for Pig 4 
fn tlytéself) => bool { 


return false; 


tn tly svatiesls Piye(¢s; T) -7 bool. { 
eo; tly) 

| 

tn ELY dvyntst aFly) <> Beol f 
= 

} 

fn main() { 
let pig = Pig; 
assert, eq! (fly static::<Pig> (pig), false); 
ler duck = Duck? 
assert. eq! (fly static: ADUE (AUEK); trie) J 
assert, eq: (fly dyn(SPig), false) ; 
assert. eq! (fly dyn(&Duck), true); 


在 代码 清单 2-53 中 ， 人 代码 第 1 行 和 第 2 行 分 别 定 义 了 两 个 结构 体 Duck 
和 Pig。 如 果 你 有 编写 面 癌 对 象 语 言 的 经 验 ， 你 甚至 可 以 将 它们 看 作 两 
yee 

代码 第 3 行 到 第 5 行使 用 trait 天 键 字 定义 了 一 个 Fly trait。 在 Rust 中 ， 
trait 是 唯一 的 接口 抽象 方式 。 使 用 trait 可 以 让 不 同 的 类 型 实现 同一 种 行 
为 ， 也 可 以 为 类 型 添加 新 的 行为 。 在 Fly trait 中 只 包含 了 一 个 函数 签名 
fly， 包 含 了 参数 及 参数 类 型 、 人 返回 值 类 型 ， 但 没有 函数 体 。 函 数 丛 名 已 
经 基本 反映 了 该 函数 的 所 有 有 意图， 在 返回 值 类 型 中 其 至 还 可 以 包含 错 谋 
处 理 相 关 的 信息 。 这 就 是 类 型 系统 市 来 的 好 处 之 一 : HEF SE. 
然 ， 在 trait 中 也 可 以 定义 函数 的 默认 实现 。 

代码 第 6 行 到 第 10 行 使 用 impl 关 键 字 为 Duck 实 现 Fly trait。 形 如 impl 
Trait for Type 的 写法 在 语义 上 也 非常 且 观 ， 可 以 表达 “为 Type 实 现 Trait 接 
口 ” 这 样 的 意思 。 在 该 段 代 码 中 ， 对 fly 函 数 坪 加 了 Duck 这 个 类 型 的 具体 
实现 。 因 为 Duck 是 可 以 执行 “ 飞 ” 这 个 动作 的 ， 所 以 其 fly 函 数 的 返回 值 为 
true. 

同 理 ， 代 码 第 11 行 到 第 15 行 使 用 impl 关 键 字 为 Pig 实 现 Fly trait. {A 
是 因为 Pig 不 能 执行 “ 飞 ” 这 个 动作 ， 所 以 fly 函 数 的 返回 值 为 false。 

这 就 是 一 种 接口 抽象 。 Duck 和 Pig 根 据 自身 的 类 型 针对 同一 个 接口 
进行 Fly， 实 现 了 不 同 的 行为 。Rust 中 并 没有 传统 面 同 对 象 语 言 中 的 继承 
的 概念 。Rust 通 过 trait 将 类 型 和 行为 明确 地 进行 了 区 分 ， 充 分 贯彻 了 组 
合 优 于 继承 和 面 癌 接口 编程 的 编程 思想。 

RAG 1647 BI 5 1847 SLE Y fly_staticiz AY pk Ae, H ye AY Be A HH 
为 T， 代 表 任 意 类 型 。T: Fly 这 种 语法 形式 使 用 Fly trait 对 泛 型 T 进 行 行 
为 上 的 限制 ， 代 表 实 现 了 Fly trait 的 类 型 ， 或 者 拥有 fly 这 种 行为 的 类 
型 。 这 种 限制 在 Rust 中 称 为 trait 限 定 (trait bound) 。 退 过 trait 限 定 ， 限 
制 了 fly_static 泾 型 冰 数 参数 的 类 型 范围 。 如 果 有 不 清和 丰 诅 限定 的 类 型 传 
入 ， 编 诺 右 融会 识别 并 报错 。 

代码 第 19 行 到 第 21 行 实现 了 fly_dyn 函 数 ， 它 的 参数 是 一 个 &Fly 类 
型 。&Fly 类 型 是 一 种 动态 类 型 ， 代 表 所 有 拥有 fly 这 种 行为 的 类 型 。 
fly_static 和 fly_dyn 的 区 别 是 ， 其 函数 实现 内 fy 方法 的 调用 机 制 不 同 。 

代码 第 22 行 到 第 29 行 的 main 函 数 调用 了 fy _static 和 fly_dyn 函 数 。 


代码 第 23 行 通过 let 声 明了 变量 pig， 并 指定 一 个 Pig 结 构 体 实例 。 代 
伺 第 24 行 使 用 了 assert! Wa, HFAA fly_static: : <Pig> (pig) 的 
调用 结果 是 否 将 会 返回 false。 其 中 : : 过 Pig> 之 这 样 的 语法 形式 用 于 给 
泛 型 国 数 指定 基体 的 类 型 ， 这 里 调用 的 是 Pig 实 现 的 fly 方 法。 

同 理 ， 代 码 第 25 行 和 第 26 行 通过 fly_static: : <Duck> (duck) ii 
用 了 Duck 实 现 的 fly 方 法 ， 并 返回 true。 

上 面 这 种 调用 方式 在 Rust FURSTE o Rust WARAN 
fly_static: : <Pig> (pig) 和 fly_static: : <Duck> (duck) 这 两 个 具 
体 类 型 的 调用 生成 尾 殊 化 的 代码 。 也 束 是 说 ， 对 于 编译 占 来 说 ， 这 种 抽 
象 并 不 存在 ， 因 为 在 编译 阶段 ， 泛 型 已 经 被 展开 为 具体 类 型 的 代码 。 

代码 第 27 行 和 第 28 行 分 别 调用 了 fly_dyn (&Pig) 和 
fly_dyn (&Duck) ， 也 可 以 实现 同样 的 效 末 。 但 是 fly_dyn 函数 是 动态 
TR 方式 的 ， 它 会 在 运行 时 得 找 相 应 类 型 的 方法 ， 会 市 来 一 定 的 运行 
时 开销 ， 不 过 这 种 开销 很 小 。 

通过 此 例 可 以 看 出 来 ，Rust 的 trait 完 全 符合 C++ 之 父 提 出 的 零 开销 
原则 ” : QUER ORME FASE MHA BLN E AT LITE ESTR) ; 
如 果 你 确实 需要 使 用 该 抽象 ， 可 以 保证 这 是 开销 最 小 的 使 用 方式 (动态 
TR) 。 目 前 在 一 些 基准 测试 中 ，Rnust 已 经 拥有 了 能 够 和 C/C++ 竞争 的 
VEE 

Rust 中 内 置 了 很 多 trait， 开 发 者 可 以 通过 实现 这 些 trait 来 扩展 目 定 义 
美 型 的 行为 。 比 如 ， 实 现 了 了 最 利用 的 Debug trait, Win WA feprintin ! 
宏 语 句 中 使 用 {: ? |} 格 式 进 行 打印 的 行为 ， 如 代码 清单 2-54 所 示 。 

代码 清单 2-54: 实现 Debug trait 


wa a ME oe Mm Ee 


LO 


= e e hae 
a WM FF O» 


use SEG? Sree 
struct. Point. 4 


impl Debug for Point { 
fn fmt (&self, I: &mut Formatter) -> Result { 
write! (fT, “Point 14 Wt tke VE +) J) y Wel Te: salt.) 
} 


= f 


s ta Wee ths 


let origin = Point { X: Ur ye P }y 
primbln! ("ihe origin iss firj"; Origini; 


=] 


在 代码 清单 2-54 中 ， 定 义 了 结构 体 Point， 为 了 给 Point 实 现 Debug 


trait， 必 须 先 使 用 use 引 入 std: : fmt 模 块 ， 因 为 Debug 是 在 其 中 定义 的 。 


Debug trait 中 定义 了 了 fmt 函数 ， 所 以 只 需要 为 Point 实 现 该 函数 即 可 ， 


如 代码 第 6 行 到 第 10 行 所 示 。 之 后 ，main 函 数 就 可 以 直接 使 用 printtn! 宏 


语句 来 打印 Point 结 构 体 实例 origin 的 值 。 


也 可 以 使 用 #[derive (Debug) ] 属性 帮助 开发 者 自动 实现 Debug 


trait。 这 类 属性 本 质 上 属于 Rust 中 的 一 种 宏 ， 在 第 12 章 中 会 评 细 介绍 关 
于 宏 的 各 种 细 廊 。 


第 3 草 会 介绍 关于 沁 型 和 trait 的 更 多 内 容 。 


2.11 IRALE 


Rust 中 的 错误 处 理 是 通过 返回 Result<T， 王 > 类 型 的 方式 进行 的 
。Result<T，E> 关 型 是 Option<T > 类 型 的 升级 版 本 ， 同 样 定义 于 标准 
EF., 

代码 清单 2-55 展 示 了 Result<T，E> 的 源码 实现 。 

代码 清单 2-55: Result<T, E> KI 


i enum Result<T, E> { 
Z SEFE » 

5 Egt (EN, 

4 } 


Option <T> KAIKET ÆA RETE, Result<T, E> RH RI 
误 的 可 能 性 ， 其 中 泛 型 E 代 表 Error。Result<T，E> 的 使 用 示例 如 代码 
清单 2-56 所 示 。 
代码 清单 2-56: Result<T, E>(#H afl 
fn main() { 

let x: Result<1i32, &str> = Ok(-3); 

assert eq! (x.is ok(), true); 

let x: Result<1i32, &str> = Err("Some error message"); 


assert eq! (x.1is_ok(), false); 


Sy on & cw hh Fe 


在 代码 清单 2-56 中 ， 分 别 定 义 了 Ok (-3) 和 Err (" Some error 
message" ) 枚 举 值 ， 可 通过 is_ok 方 法 来 判断 是 售 为 Ok (T) M. 

和 Option<T> 类 似 ， 可 以 将 Result<T，E> 作 为 函数 返回 值 。 这 样 
一 来 ， 在 调用 该 函数 的 时 候 ， 如 果 返 回 类 型 是 Resut<T, E>, WAF 
发 者 束 不 得 不 处 理 正常 和 错误 这 两 种 情况 ， 这 束 为 程序 的 健壮 性 提供 了 
保证 。 

在 Rust 2015 (RASH, mainke lResult<T, E>. (He 
在 实际 开 肥 中， 二 进 制 可 执行 库 也 需要 返回 销 误 ， 比 如 ， 谈 取 文 件 的 时 


候 发 生 了 错误 ， 这 时 需要 正常 退出 程序 。 于 是 在 Rust 2018 (KA, Č 
许 main 函 数 返 回 Result<T，E> 了 ， 如 代码 清单 2-57 所 示 。 

代码 清单 2-57: maine 207 3k Pl Resut<T, E> 

1. // Rust 2018 版 本 


f. use std::fs::File; 
oe in Maan) => Resule<(), Sd 6: S ErrOr> 4 
4. let £ = File: Open Bare tub ?; 

5 i Ok (()) 

6. } 


代码 清单 2-57 中 的 main 函 数 通 过 调用 File: : open 方 法 打开 一 个 文 
件 ， 后 面 跟随 的 问号 操作 和 人 符 “? ) 是 一 个 错误 人 处理 的 语法 糖 ， 它 会 自动 
在 出 现 错误 的 情况 下 返回 ”std: : io: : Error。 这 样 就 可 以 在 程序 发 生 
错误 时 目 动 返回 错误 码 ， 并 在 退出 程序 时 打印 相关 的 错误 信息 ， 方 便 调 
试 ， 而 不 雷 要 开 友 者 手动 处 理 错误 了 。 

关于 错误 处 理 的 更 多 细节 会 在 第 9 重 进 行 详细 阐述 。 


2.12 表达 式 优 先 级 


在 Rust 中 ， 一 切 香 表达 式 ， 那 么 了 解 表 达 云 的 优先 级 吏 非 营 重 要 
了 ， 表 2-1 将 Rust 的 操作 从 和 表达 式 按 优先 级 由 高 到 低 的 顺序 列 了 出 来 ， 
其 有 相同 优先 级 的 操作 符 按 相关 性 给 定 的 顺序 进行 优先 级 计算 。 
表 2-1: 操作 符 和 表达 式 的 优先 级 
操作 人 符 或 表达 式 相关 性 
RIE (Path) 
方法 调用 (Method Call) 
字段 表达 式 (Field Expression) Nie BA 
图 数 调用 、 数 组 索引 
问号 操作 待 〈《?) 
一 元 操作 符 (-、*、!、&、&mut) 


as 

一 元 计算 全、 大 %) 从 左 到 右 
二 元 计算 (+ 、- 从 左 到 右 
位 移 计算 (<<, >>) 从 左 到 右 
位 操作 〈&) 从 左 到 右 
位 操作 O) 从 左 到 右 
位 操作 (|) 从 左 到 右 
比较 操作 (==, I=, <> h >=) 需要 括号 
逻辑 与 (&&) 从 左 到 右 
wea 从 左 到 右 
范围 (..、.=) 需要 括号 
RERE (= jay -5 * 局 YA Ge By gE Be) 从 右 到 左 


return, break |4] 


2.13 注释 与 打印 


Rust 是 一 门 现代 语言 ， 这 一 点 从 注释 方面 也 能 体现 出 来 。Rust 文 档 
的 次 学 古 : 代码 即 文档 ， 文 档 即 代 人 码 。 

所 以 Rust 文 持 的 注释 种 类 比较 丰富 ， 介 绍 如 下 。 

` 普通 的 注释 。 

> 使 用 // 对 整 行 注释 。 

> 使 用 /*...*/ 对 区 块 注释 。 

:文档 注释 ， 内 部 文 持 Markdown 标 记 ， 也 文 持 对 文档 中 的 示例 代码 

进行 测试 ， 可 以 用 rustdoc 工 具 生 成 HTML 文 档 。 

> 使 用 /// 注释 可 以 生成 库 文档 ， 一 般 用 于 函数 或 结构 体 的 说 明 ， 
置 于 说 明 对 象 的 上 方 。 

> 使 用 //! 也 可 以 生成 库 文 要 ， 一 般 用 于 说 明 整 个 模块 的 功能 ， 置 
于 模块 文件 的 头 部 。 

代码 清单 2-58 展 示 了 不 同 种 类 的 注释 。 

代码 清单 2-58: 注释 示例 


1. /// # 文档 注释 : Sum 函数 

2. /// 该 函数 为 求 和 函数 

3. /// # usage: 

ka =f TF assert eq! (3; sum(l, 217? 

Ds fA Simla: 132; BY 13:2) — 132 4 

6. a + b 

Te } 

Sa TO Ment) t 

9. // 这 是 单行 注释 的 示例 

i p% 

be * 这 是 区 块 注释 ， 被 包含 的 区 域 都 会 被 注释 
L2. * 你 可 以 把 /* BR */ 置 于 代码 中 的 任何 位 置 
Le x J 

Li ia 


15, 注意 上 面 区 块 注释 中 的 * 符 号 纯粹 是 一 种 注释 风格 ， 
16. 实际 并 不 需要 


he ard 

18. Let. ci 5 a y* S80 t =P D? 

13s assert eq! (x, 10); 

20 5 Brantlni ("2 + 3 = 13", smil Si)? 
za 


代码 清单 2-58 展 示 了 文档 注释 和 普通 的 注释 。 使 用 cargo _ doc 命令 可 
以 将 文档 注释 直接 生成 HTML 格式 的 文档 ， 普 通 的 注释 和 其 他 语言 中 的 
注释 没什么 区 列 。 

读者 也 可 以 参考 本 书 的 随 书 源码 ， 其 中 大 量 使 用 了 文档 注释 。 男 外 
Rust 还 文 持 文 档 测 试 ， 在 第 9 半 会 评 细 介绍 。 

在 日 常 开发 中 ， 我 们 经 常会 使 用 printIn! 宏 语句 来 进行 格式 化 打 
印 ， 这 对 于 调试 代码 非常 重要 。Pprintin! 宏 中 的 格式 化 形式 列表 如 下 : 

nothing 代表 Display， 比 如 printn! ("{}",，2)。 

-? 代表 Debug， 比 如 printn! C"{: ?}", 2). 

:0 代表 八进制 ， 比 如 println! C"{: o}"，2) 。 

x 代表 十 六 进 制 小 号 ， 比 如 printtn! ("{: x}", 2) . 


X 代表 十 六 进 制 大 写 ， 比 如 println! C"{: X}", 2) . 
. p 代表 指针 ， 比 如 printIn! C"{: p}", 2) 。 

-b 代表 二 进 制 ， 比 如 println! ("{: b}"，2)。 
e 代表 指数 小 号 ， 比 如 printtn! ("If{: e}", 2) 。 
下 代表 指数 大 写 ， 比 如 printtn! ("{: E}", 2) 。 


2.14 小 结 


Rust 是 一 门 表达 式 语言 ，Rust P-Y EKAR. Æ Rust 的 学 习 
中 ， 尘 握 表 达 式 的 求 值 机 制 很 重要 。 

本 半 首 先 介 绍 了 Rust 中 表达 式 的 分 类 和 性 质 ， 从 而 帮助 读者 测 握 
Rust 中 表达 式 的 求 值 机 制 。 不 管 Rust 有 多 少 种 表达 式 ， 它 们 都 包含 在 此 
分 类 中 ， 并 符合 这 些 性 质 。 同 时 也 介绍 了 什么 是 常量 表达 式 和 CTFE 机 
制 ， 以 及 Rust 中 的 CTFE 的 发 展 方 问 。 

其 中 值得 注意 的 是 ，if 流 程控 制 在 Rust 中 也 是 表达 式 ， 所 以 Rust 不 
需要 单独 提供 ? : 条 件 表达 式 。 当 处理 一 些 Option 类 型 的 时 候 ， 可 以 用 
if let 或 while jlet 表 达 式 来 简化 代码 。 然 后 通过 一 些 示 例 对 循环 表达 式 做 
了 深入 探讨 ， 揭 示 了 Rust 编 译 期 对 while 循 环 条 件 不 进行 求 值 的 事实 ， 这 
同样 也 是 因为 党 到 了 CTEFE 蕊 能 的 限制 。 所 以 如 果 需 要 使 用 无 限 循环 ， 
则 要 使 用 loop 循 环 。 

本 章 还 依次 介绍 了 Rust 中 的 一 些 重要 的 语法 要 素 ， 目 的 是 让 读者 了 
解 Rust 的 语法 风格 ， 通 过 对 这 些 概念 和 示例 的 掌握 ， 消 除 对 Rust 语 言 的 
卫生 感 ， 从 而 为 后 面 的 深入 学 习 做 好 准备 。 





[该 特性 在 RFC1909 中 被 描述 。 


OE 类 型 系统 


本 性 决定 行为 ， 本 性 取决 于 行为 。 

众所周知 ， 计 算 机 以 二 进 制 的 形式 来 存储 信息 。 对 于 计算 机 而 言 ， 
不 党 什么 样 的 信息 ， 都 只 是 0 和 1 的 排列 ， 所 有 的 信息 对 计算 机 来 说 只 不 
过 是 字 节 序列 。 作 为 开发 人 员 ， 如 果 想 要 存储 、 表 示 和 人 处理 各 种 信息 ， 
直接 使 用 0 和 1 必然 会 产生 巨大 的 心 知 负担， 所以， 类 型 应 运 而 生 。 类 型 
于 20 世 纪 50 年 代 被 FORTRAN 语 言 引 入 ， 历 经 诸多 高 级 语言 的 洗礼 ， 其 
相关 的 理论 和 应 用 已 经 用 展 得 非常 成 束 。 下 到 现代 ， 凑 型 已 经 成 为 了 各 
大 编程 语言 的 核心 基础 。 


3.1 通用 概念 


所 请 类 型 ， 其 实 丈 是 对 表示 信息 的 值 进行 的 细 粒 度 的 区 分 。 比 如 整 
Bl. hn MASE, MARE R MEKE FP SAME. TOTS 
BAE FR BOARS. OU BOB PRP, HELA KI 
目 定义 的 类 型 。 不同 的 类 型 占用 的 内 存 个 同 。 与 直接 操作 比特 位 相 比 ， 
直接 操作 类 型 可 以 更 安全 、 更 有 效 地 利用 内 存 。 例 如 ， 在 Rust 语 言 中 ， 
如 果 你 创建 一 个 u32 类 型 的 值 ，Rust 会 自动 分 配 4 个 字 节 来 存储 该 值 。 

计算 机 不 只 是 用 来 存储 信息 的 ， 它 还 需要 处 理 信息 。 这 束 必 然 会 面 
临 一 个 问题 : 不 同 的 类 型 该 如 何 计 算 ? 因此 需要 对 这 些 基本 的 类 型 定义 
一 系列 的 组 合 、 运 算 、 转 换 等 方法 。 如 果 把 编程 语言 看 作 虚 拟 世 界 的 
话 ， 那 么 类 型 就 是 构建 这 个 世界 的 基本 粒子 ， 这 些 类 型 粒子 通过 各 种 组 
合 、 运 算 、 转 换 等 “物理 化 学 反应 ?”， 造 束 了 此 世界 中 的 各 种 “事物 ”。 关 
型 之 间 的 纷 索 复杂 的 交互 形成 了 类型 系统 ， 关 型 系统 是 编程 语言 的 基础 
和 核心 ， 因 为 编程 语言 的 目的 融 是 存储 和 处 理 信 息 。 不 同 编程 语言 之 间 
的 区 列 束 在 于 如 何 存储 和 处 理 信息 。 

其 实在 计算 机 科学 中 ， 对 信息 的 存储 和 处 理 不 止 类 型 系统 这 一 种 方 
式 ， 还 有 其 他 的 一 些 理论 框架 ， 只 不 过 类 型 系统 是 最 轻 量 、 最 完善 的 一 
种 方式 。 在 类 型 系统 中 ， 一切 宪 类 型 。 基 于 类 型 定义 的 一 系列 组 合 、 
运算 和 转换 等 方法 ， 可 以 看 作 类 型 的 行为 ”。 类 型 的 行为 决定 了 类 型 该 
如 何 计算 ， 同 时 也 是 一 种 约束 ， 有 了 这 种 约束 才 可 以 你 证 信息 个 正确 处 
ee 


3.1.1 类 型 系统 的 作用 


关 型 系统 是 一 门 编程 语言 不 可 或 缺 的 部 分 ， 它 的 优势 有 以 下 几 个 方 
面 。 

ARERR. 很 多 编程 语言 部 会 在 编 详 期 或 运行 期 进行 类 型 检 枉 ， 
以 排 租 违规 行为 ， 你 证 程序 正确 执行 。 如 条 程序 中 有 关 型 不 一 致 的 情 
况 ， 或 有 未 定义 的 行为 友 生 ， 则 可 能 导致 错误 的 产生 。 尤 其 是 对 于 静态 
语言 来 说 ， 能 在 编 详 期 排 俘 出 错误 是 一 个 很 大 的 优势 ， 这 样 可 以 及 早 地 


ATE fal el, TT ANE BIS AT a ASA S FARR 

` 抽象 。 类 型 允许 开发 者 在 更 局 层面 进行 思考 ， 这 种 抽象 能 力 有 助 
于 强化 编程 规 疙 和 工程 化 系统 。 比 如 ， 面 同 对 象 语言 中 的 类 就 可 以 作为 
一 种 类 型 。 

文档 。 在 阅读 代码 的 时 候 ， 明 确 的 类 型 声明 可 以 表明 程序 的 行 

为 。 
: 优化 效率 。 这 一 点 是 针对 静态 编译 语言 来 说 的 ， 在 编译 期 可 以 通 
过 类 型 检查 来 优化 一 些 操作 ， 市 省 运行 时 的 时 间 。 

Ne 

> 类 型 安全 的 语言 可 以 避免 类 型 间 的 无 效 计算 ， 比 如 可 以 避免 3/ 
"hello" 这 样 不 符合 算术 运算 规则 的 计算 。 

类 型 安全 的 语言 还 可 以 保证 内 存 安全 ， 如 免 诸 如 空 指针 、 基 竺 
利 针 和 组 存 区 溢出 等 导致 的 内 存 安全 问题 。 

> 类 型 安全 的 语言 也 可 以 避免 语义 上 的 逻辑 错误 ， 比 如 以 嗓 米 为 
单位 的 数值 和 以 厘米 为 单位 的 数值 虽然 都 是 以 整数 来 存储 的 ， 但 可 以 用 
不 同 的 类 型 来 区 分 ， 避 人 免 逻 辑 错误 。 

虽然 类 型 系统 有 这 么 多 优点 ， 但 并 非 所 有 的 编程 语言 都 能 百 分 百 拥 
有 这 些 优点 ， 这 与 它们 的 类 型 系统 的 具体 设计 和 实现 有 关系 。 


3.1.2 类 型 系统 的 分 类 


在 编译 期 进行 类 型 检查 的 语言 属于 静态 类 型 ”， 在 运行 期 进行 类 型 
检查 的 语言 属于 动态 类 型 ” 。 如 果 一 门 语言 不 允许 类 型 的 自动 隐 式 转 
换 ， 在 强制 转换 前 不 同类 型 无 法 进行 计算 ， 则 该 语言 属于 强 类 型 ， 反 
之 则 属于 弱 类 型 UL, 

静态 类 型 的 语言 能 在 编译 期 对 代码 进行 静态 分 析 ， 依 靠 的 就 是 类 
型 系统 。 我 们 以 数组 越界 访问 的 问题 为 例 来 说 明 。 有 些 静态 语言 ， 如 C 
和 C++， 在 编译 期 并 不 检查 数组 是 否 越界 访问 ， 运 行 时 可 能 会 得 到 难以 
意料 的 结果 ， 而 程序 依旧 正常 运行 ， 这 属于 类 型 系统 中 未 定义 的 行为 ， 
所 以 它们 不 是 类 型 安全 的 语言 。 而 Rust 语 言 在 编译 期 就 能 检查 出 数组 
是 否 越界 访问 ”， 并 给 出 警告 ， 让 开发 者 及 时 修改 ， 如 果 开 发 者 没有 修 


改 ， 那 么 在 运行 时 也 会 抛 出 错误 并 退出 线程 ， 而 不 会 因此 去 访问 非法 的 
内 存 ， 从 而 保证 了 运行 时 的 内 存 安 全 ， 所 以 Rust 是 类 型 安全 的 语言 。 
强大 的 类 型 系统 也 可 以 对 类 型 进行 目 动 推导 ”， 因 此 一 些 静 态 语 言 在 编 
与 代 人 码 的 时 候 不 用 显 式 地 指定 上 其 体 的 类 型 ， 比 如 Haskel WIER Aha xk 
静态 类 型 。Rust 语言 的 类 型 系统 受 Haskell 启 发 ， 也 可 以 自动 推导 ， 但 不 
如 Haskell 织 大 。 在 Rust 中 大 部 分 地 方 还 是 需要 显 式 地 指定 类 型 和 虹 ， 类 型 
是 Rust 语 法 的 一 部 分 ， 因 此 Rust 属 于 显 式 静态 类 型 。 

动态 类 型 的 语言 只 能 在 运行 时 进行 类 型 检查 ， 但 是 当 有 数组 越界 访 
间 时 ， 残 会 抛 出 民间 ， 执 行 线程 退出 操作 ， 而 不 是 给 出 奇怪 的 结果 。 所 
以 一 些 动 态 语言 也 是 类 型 安全 的 ， 比 如 Ruby 和 Python 语 言 。 在 其 他 语言 
中 作为 基本 类 型 的 上 整数、 字符 串 、 布 尔 值 导 ， 在 Ruby 和 和 Python 语言 中 者 
是 对 象 。 实 际 上 ， 也 可 将 对 象 看 作 类 型 ，Ruby 和 Python 语言 在 运行 时 通 
过 一 种 名 为 Duck  Typing 的 手段 来 进行 运行 时 次 型 检 符 ， 以 保证 类 型 安 
全 。 在 Ruby 和 和 Python 语言 中 ， 对 象 之 间 退 过 消 晨 进行 通信 ， 如 果 对 象 可 
以 啊 应 该 消 奶 ， 则 说 明 该 对 象 束 是 正确 的 类 型 。 

对 象 是 什么 样 的 类 型 ， 决 定 了 它 有 什么 样 的 行为 ， 反 过 来 ， 对 象 在 
不 同上 下 文中 的 行为 ， 也 决定 了 它 的 类 型 。 这 其 实 是 一 种 多 态 性 。 


3.1.3 类 型 系统 与 多 态 性 


如 果 一 个 类 型 系统 允许 一 段 代 人 码 在 不 同 的 上 下 文中 具有 不 同 的 类 
型 ， 这 样 的 类 型 系统 束 叫 作 多 态 类 型 系统 。 对 于 毅 态 类 型 的 语言 来 
说 ， 多 态 性 的 好 处 是 可 以 在 不 影响 类 型 丰 曙 的 前 提 下 ， 为 不 同 的 类 型 纺 
与 通用 的 代码 。 

现代 编程 语言 包含 了 三 种 多 态 形 式 : 参数 化 多 态 (Parametric 
polymorphism ) 、Ad-hoc 多 态 (Ad-hoc polymorphism ) 和 子 类 型 多 
态 (Subtype polymorphism ) > WRZE SREE RRIS, XH 
分 为 静 多 态 (Static Polymorphism ) 和 动 多 态 (Dynamic 
Polymorphism ) 。 衣 多 态 发 生 在 编译 期 ， 动 多 态 发 生 在 运行 时 。 参 数 
化 多 态 和 Ad-hoc ZS -REREN TRES REDEN. L 
人 态 物 牲 灵 活性 获取 性 能 ， 动 多 态 牺 牲 性 能 获取 灵活 性 。 动 多 态 在 运行 时 
需要 伍 表 ， 占 用 较 多 空间 ， 所 以 一 般 悄 况 下 都 使 用 前 多 态 。Rust 语 言 同 
IY SC FP ae ANS ASN, SS AN Le SS CAST RR 


BBM AS Lip wire fai o IRIN PR ER ALB AR A A Fe 
用 于 多 种 类 型 ， 以 避免 大 量 的 重复 性 工作 。 泛 型 使 得 语言 极其 表达 力 ， 
同时 也 能 保证 静态 类 型 安全 。 

Ad-hoc 多 态 也 叫 特定 多 态 。Ad-hoc 短 语源 自 拉 丁 语 系 ， 用 于 表示 
一 种 特定 情况 。Ad-hoc 多 态 是 指 同 一 种 行为 定义 ， 在 不 同 的 上 下 文中 
会 啊 应 不 同 的 行为 实现 。Haskell 语言 中 使 用 Typeclass 来 文 择 Ad-hoc 多 
态 ，Rust 受 Haskell 启 发 ， 使 用 trait 来 支持 Ad-hoc 多 态 。 所 以 ，Rust 的 trait 
系统 的 概念 类 似 于 Haskell 中 的 Typeclass。 

子 类 型 多 态 的 概念 一 般 用 在 面 癌 对 象 语言 中 ， 尤 其 是 Java 语 言 。 
Java 语 言 中 的 多 态 束 是 子 类 型 多 态 ， 它 代表 一 种 包 食 关系 ， 父 类 型 的 值 
包含 了 子 类 型 的 值 ， 所 以 子 类 型 的 值 有 时 也 可 以 看 作 父 类 型 的 值 ， 反 之 
则 不 然 。 而 Rust 语 言 中 并 没有 类 似 Java 中 的 继承 的 概念 ， 所 以 也 不 存在 
子 类 型 多 态 。 所 以 ，Rust 中 的 类 型 系统 目前 只 文 持 参数 化 多 态 和 Ad- 
hoc 多 态 ， 也 吏 是 ， 汉 型 和 trait 。 


3.2 Rust 类 型 系统 概述 


Rust 是 一 门 强 类 型 日 类 型 安全 的 裔 态 语 言 。Rust 中 一 切 丝 表达 式 ， 
RIAA AE, EEGA., Area Wit, Rutt ~H eRe . 

除了 一 些 基 本 的 原生 类 型 和 复合 类 型 ，Rust 把 作用 域 也 纳入 了 类 型 
系统 ， 这 吏 是 第 4 章 将 要 学 到 的 生命 周期 标记 。 还 有 一 些 表 达 式 ， 有 时 
AIRE, AISA IRMA 〈 也 残 是 只 返回 单元 值 ) ， 或 者 有 时 返回 正 
WANE, ARRERA, Rust 将 这 类 情况 也 纳入 了 类 型 系统 ， 也 束 
征 Option<T > 和 Result<T，E> 这 样 的 可 选 闫 型， 从 而 强制 开 及 人员 必 
须 分 别处 理 这 两 种 情况 。 一 些 根本 无 法 返回 值 的 情况 ， 比 如 线程 朋 泪 、 
break 或 continue 等 行为 ， 也 都 和 被 纳入 了 类 型 系统 ， 这 种 类 型 叫 作 never 交 
型 。 可 以 说 ，Rust 的 类 型 系统 基本 守 插 了 编程 中 会 过 到 的 各 种 情况 ， 一 
般 情 况 下 不 会 有 末 定 义 的 行为 出 现 ， 所 以 说 ，Rust 是 类 型 安全 的 语言 。 


3.2.1 类 型 大 小 


编程 语言 中 不 同 的 类 型 本 质 上 是 内 存 占用 空间 和 编码 方式 的 不同 ， 
Rust 也 不 例外 。Rust 中 没有 GC， 内 存 站 先 由 编译 右 来 分 配 ，Rust 代 人 码 被 
编译 为 LLVM IR， 其 中 携 市 了 内 存 分 配 的 信息 。 所 以 编译 占 前 要 事先 
知道 英 型 的 大 小 ， 才 能 分 配合 理 的 内 存 。 

可 确定 大 小 类 型 和 动态 大 小 类 型 

Rust 中 绝 大 部 分 类 型 都 是 在 编译 期 可 人 确定 大 小 的 类 型 (Sized 
Type) ”， 比 如 原生 整数 类 型 u32 固 定 古 4 个 字 节 ，u64 回 定 是 8 个 字 市 ， 
等 等， 都 是 可 以 在 编译 期 确定 大 小 的 类 型 。 然 而 ，Rust 也 有 少量 的 动态 
大 小 的 类 型 (Dynamic Sized Type, DST) ， 比 如 str 类 型 的 字符 串 字 面 
量 ， 编 详 需 不 可 能 事先 知道 程序 中 会 出 现 什么 样 的 字符 串 ， 所 以 对 于 编 
详 需 来 说 ，str 类 型 的 大 小 是 无 法 确定 的 。 对 于 这 种 情况 ，Rust 提 供 了 引 
用 类 型 ， 因 为 引用 总 会 有 固定 的 且 在 编 诺 期 已 知 的 大 小 。 字 符 串 切 搬 
&str 了 驶 是 一 种 引用 类 型 ， 它 由 指针 和 长 度 信 息 组 成 ， 如 图 3-1 所 示 。 





图 3-1: &str 由 指针 和 长 度 信息 组 成 


&str 存 储 于 栈 上 ，str 字 人 符 串 序列 存储 于 堆 上 。 这 里 的 扒 和 栈 是 指 不 
同 的 内 存 空间 ， 在 第 4 章 会 详细 介绍 。&str 由 两 部 分 组 成 :指针 和 长 度 
信息 ， 如 代码 清单 3-1 所 示 。 其 中 指针 是 固定 大 小 的 ， 存 储 的 是 str 字符 
串 序 列 的 起 始 地 址 ， 长 度 信息 也 是 固定 大 小 的 整数 。 这 样 一 来 ，&str 束 
变 成 了 可 确定 大 小 的 类 型 ， 编 译 融 束 可 以 正确 地 为 其 分 配 栈 内 存 空间 ， 
str 也 会 在 运行 时 在 扒 上 开辟 内 存 空间 。 

代码 清单 3-1: &str 的 组 成 部 分 

1 fn main() { 

2 let str = "Hello Rust"; 

3. let ptr = str.as_ptr(); 

4. let len = str.len(); 

5 printin!(™{sp}", peri: Jy OxS55db4b96c00 

6 printla! tI denie jy 10 
¥ } 


代码 清单 3-1 声 明了 字符 串 字 耐量 str， 通 过 as_ptr() Mer O F 
法 ， 可 以 分 别 获 取 充 字符 串 字 面 量 存储 的 地 址 和 长 度 信息 。 这 种 包含 
动态 大 小 类 型 地 址 信息 和 携 市 了 长 上 度 信息 的 指针 ， 叫 作 胖 指针 (Fat 
Pointer) ， 所 以 &str 是 一 种 胖 指针 。 

与 字符 串 切片 同 理 ，Rust 中 的 数组 [T] 古 动态 大 小 类 型 ， 编 译 桥 难以 
确定 它 的 大 小 。 如 代码 清单 3-2 所 示 是 将 数组 直接 作为 疯 数 参数 的 情 
pu 


代码 清单 3-2: 将 数组 直接 作为 函数 参数 


1. fn reset(mut arr: [u32]) { 

2 ane [Ol] = 5; 

S arr[1] = 4; 

4 arr[2] = 3; 

2 arr[3] = 2; 

6 arr[4] = 1; 
Pa PEARELHE (*SSset ary (F7); BEEJ)? 
SB. | 
de £m maint) 4 
10; let arr: [32] = [Ly Ry Sy 4e SI 
Ls reset (arr); 
12s princin! ("origin are [177 apr); 
a 了 


代码 清单 3-2 编 译 会 报错 : 
fn reset (mut arr: [u32]) { 
| ARAARA  *Tu32]° does not have a constant size known at 
compile-time 
意思 是 ， 编 译 器 无 法 确定 参数 [u32] 类 型 的 大 小 。 有 两 种 方式 可 以 修 
复 此 错误 ， 第 一 种 方式 是 使 用 ru32; 5] 类 型 ， 如 代码 清单 3-3 所 示 。 
代码 清 单 3-3: 函数 参数 使 用 [u32; 5] 类 型 


i. fn reset(mut arr: [u32; 5]) { 

2 arr[0] = 5; 

J arr[1] = 4; 

4, arr[2] = 3; 

5, arr[3] = 2; 

6. arr[4] = 1; 

T, erincini ("resek art fst)", arri: 77 [Se br Sp Ze L 
B. } 

9, fn main() { 

AMAR let ares [u327 5] = [l; 2, 3, 4, l3 

Li reset (arr); 

12. printin! (origin, ary ye SEJ J7 Lly Z; Sy My 5] 
13. } 


代码 消 千 3-3 能 够 正 征 编译， 从 输出 结 来 可 以 看 出 来 ， 修 改 的 数组 
并 未 影响 原来 的 数组 。 这 是 因为 u32 类 型 是 可 复制 的 类 型 ， 实 现 了 Copy 
trait， 所 以 整个 数组 也 是 可 复制 的 。 所 以 当 数 组 被 传 入 函数 中 时 就 会 被 
复制 一 份 新 的 副本 。 这 里 值得 注意 的 是 ，[u32] 和 [u32; 5] 古 两 种 个 同 的 
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另外 一 种 解决 代码 清单 ”3-2 编译 错误 的 方式 是 使 用 胖 指 针 ， 类 似 
&str， 这 里 只 需要 将 参数 类 型 改 为 &mut [uu32] 即 可 。&mut ”[u32] 是 对 
[u32] 数 组 的 借用 ， 会 生成 一 个 数组 切片 &[u32]， 它 会 携带 长 度 信 息 ， 如 
代码 清单 3-4 所 示 。 

代码 清单 3-4: 使 用 &mut [u32] 作 为 参数 类 型 


le fn reset(arr: &mut [u32]) { 
A arr[0] = 5; 
3. arr[1l] = 4; 
4. arr[2] = 3; 
J: arra] = 2: 
6. arr[4] = 1; 
T // €825, A ERAI [B 4, 3, 2, 1] 
8. pranilnl (array lenges. 27)", @arr.ien (i): 
9. Jf See ORELLA [Sy Íy Sy By 1] 
10. printin! ("reset array {:?}"; arr); 
like, } 
1Z CA wain) 1 
(en A leks muit arr = [ly 2, 2, Up Oo]? 
14. // tirn, BIKA [1, 2, 3, 4, 5) 
ifea printin! ("reset peTore i origin array {12} "p art); 
16. { 
te i let mut arr: émut [u32] = mut. arr; 
18. reset (mut arr); 
1%. } 
20). printin! ("reset after i GFlgin array {57}", air) ; 
Pol, |} 


AAs 3-4 中 使 用 了 &mut [u32]， 它 是 可 变 借 用 ，&[u32] 是 不 可 
变 借 用 。 因 为 这 里 要 修改 数组 元 双 ， 所 以 使 用 可 变 借 用 。 从 输出 的 结 
可 以 看 出 ， 胖 指针 &mut [ua32] 包 含 了 长 度 信息 。 将 引用 当 作 函数 参数 ， 
意味 看 被 修改 的 是 原 数组 ， 而 不 是 最 新 的 数组 ， 所 以 原 数 组 在 reset 之 后 
也 发 生 了 改变 。 

代码 清单 3-5 比 较 了 &[u32; 5] 和 &mut [uu32] 两 种 类 型 的 空间 占用 情 
Diis 

代码 清单 3-5: 比较 &[u32; 5] 和 &mut  [u32] 两 种 类 型 的 空间 占用 
情况 


fn main() { 
assert ed! (SEd: imen: isre off i<&[us2; S]>{), 8); 
assert eq! (Stds ymem seize Ofer ysémut [32 )(), 16)3 
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} 


代码 清单 3-5 中 的 std: : mem: : size of<&[u32; 5> O MACH 
以 返回 类 型 的 字 市 数 。 输 出 结果 分 列 为 8 和 16。&[u32; 5] 类 型 为 普通 指 
多 出 了 一 倍 的 占用 空间 ， 这 也 是 称 其 为 胖 指 针 的 原因 。 

零 大 小 类 型 

除了 可 确定 大 小 类 型 和 DST 类 型 ，Rust 还 文 持 零 大 小 类 型 (Zero 
Sized Type, ZST) ， 比 如 单元 类 型 和 单元 结构 体 ， 大 小 都 是 零 。 代 码 
清单 3-6 展 示 了 一 组 零 大 小 的 类 型 。 

代码 清单 3-6: 一 组 零 大 小 的 类 型 示例 


i enum Void {} 

Li struct Fog; 

SA Struct, Baz 4 

4. Loot ECO, 

om qux: (), 

6. bag: [wor Ul; 

iP } 

8. In maint) | 

Bo assert. eg) (Sta items isize obii<(j>(), 0) F 
LO. assert. eq! (stds imemi size ofits Foor(), U) 
Ls assert Be (STGs:Memiteilze Gls s<Baz>()» Ui? 
LZ. 二 ST! IBRA neni tei Ze YY 9 
LS. oer eg! (Suan meni esire ces (t)e 1O)]St), Oe 
14. } 


代码 清单 3-6 编 译 输出 的 类 型 大 小 均 为 零 。 所 以 ， 单 元 类 型 和 单元 
结构 体 大 小 为 零 ， 由 单元 闫 型 组 成 的 数组 大 小 也 为 零 。ZST 交 型 的 特 
氮 和 是， 它们 的 值 融 是 其 本 号 ， 运 行 时 并 不 占用 内 存 空间 。 ZST 类 型 代 
表 的 意义 正 是 “ 空 ”。 


代码 清单 3-7 展 示 了 使 用 单元 类 型 来 全 看 数据 类 型 的 一 个 技巧 。 
代码 清香 3-7: 使 用 单元 类 型 但 看 数据 类 型 


is fn main() 1 


LZ let v: () = vec! [(); 10]; 

5. | 

代码 清单 3-7 ees, WF: 

| let v: () = vec! [(); 10]; 

| SORES eted (hk, Conn SELUGE SECI Vea Vee 


编译 器 会 提示 : 期 望 的 是 单元 类 型 ， 这 是 因为 代码 里 直接 指定 了 单 
元 类 型 ， 但 是 却 发 现 了 std: : vec: : Vec 类 型 。 这 样 我 们 就 知道 了 右 值 
vec! [() ; 10] 是 向 量 类 型 。 

代码 清单 3-8 展 示 了 一 种 欠 代 技巧 ， 使 用 Vec 有 过 O SARAN, 

代码 清单 3-8: 使 用 Vec< O 二 > 迭代 类 型 


1 fn main() { 

2 let v: Vec<()> = vec! [(); 10]; 
5: fOr 下 iny t 

4 PELntlAL( fer ps 2)? 

5 } 

6 } 


在 代码 清单 3-8 中 ， 使 用 了 Vec 二 () 二 > 类型， 使 用 单元 类 型 制造 了 
一 个 长 度 为 10 的 同 量 。 在 一 些 只 需要 旭 代 次 数 的 场合 中 ， 使 用 这 种 方式 
能 获得 较 遍 的 性 能 。 因 为 Vec 内 部 友 代 硕 中 会 针对 ZST 关 型 做 一 些 优 
化 。 

另外 一 个 使 用 单元 类 型 的 示例 是 在 第 2 章 中 介绍 过 的 Rust 官 方 标准 
库 中 的 HashSet<T>> 和 BTreeSet<T>>。 它 们 其 实 只 是 把 HashMap 到 区 ， 
TIT 二 换 成 了 HashMap 二 K，“【〈) >, Aamin LASER HashMap<kK, T> 
之 前 的 代码 ， 而 不 需要 再 重新 实现 一 过 HashSet<T 之 了 。 

REKA 

后 类 型 (Bottom Type) 是 产 目 类 型 理论 的 术语 ， 它 其 实 是 第 2 半 介 
绍 过 的 never 类 型 。 它 有 的 特点 是 : 


OA MB 

` 是 其 他 任意 类 型 的 子 类 型 。 

如 条 说 ZSIT 关 型 表示 “ 空 ?” 的 话 ， 那 么 辰 类 型 驶 表示 “无 ?>。 后 类 型 
无 值 ， 而 且 它 可 以 等 价 于 任意 类 型 ， 有 点 无 中 生 有 之 意 。 

Rust PARA AIMS C!) 表示 。 此 关 型 也 被 称 为 Bang Type. 
Rust 中 有 很 多 种 情况 确实 没有 值 ， 但 为 了 类 型 安全 ， 必 须 把 这 些 情 况 纳 
入 类 型 系统 进行 统一 处 理 。 这 些 情况 包括 : 

RAE AL (Diverging Function ) 

- continue fllbreak Hf 

loop 循环 

. TIS ， 比 如 enum Void{} 

FORA SPSL. RN RAGE TA SIAR RE ARTA panic! (" 
This function never returns! ") ， 或 者 用 于 退出 晒 数 的 std: : 
process: : exit， 这 关 函 数 永远 都 不 会 有 返回 值 。continue 和 break 也 是 关 
似 的 ， 它 们 只 是 表示 流程 的 跳 转 ， 并 不 会 返回 什么 。loop 人 循环 虽然 可 以 
返回 某 个 值 ， 但 也 有 需要 无 限 循环 的 时 候 。 

Rust 中 让 语句 是 表达 式 ， 要 求 所 有 分 文革 型 一 致 ， 但 是 有 的 时 候 ， 
分 文中 可 能 包含 了 永远 无 法 返回 的 情况 ， 属 于 撒 类 型 的 一 种 应 用 ， 如 代 
码 清单 3-9 所 示 。 

代码 清单 3-9: 底 类 型 的 应 用 


#! [feature (never type) ] 
in £6o() > l4 
fy eee 


igop {i erincig itin" J 


O Ono OO B w O F 
taya 


fn main() { 
let 1 = if false { 
Too (); 

} else { 
10. 100 
lets F 
LZ; assert eq! (1, 100); 
Los 4 


AS -9HARI SCH, foork BGKIBI! ， 而 else 表 达 式 返回 
整数 类 型 ， 但 是 编 诺 可 以 正 负 通过 ， 假 如 把 else 表 达 却 中 的 整数 类 型 换 
成 字符 串 或 其 他 类 型 ， 编 诺 也 可 以 通过 。 

24S, [KE enum Void{}， 完 全 没有 任何 成 员 ， 因 而 无 法 对 其 进 
行 变 量 绑 定 ， 不 知 填 如何 初始 化 并 使 用 它 ， 所 以 它 也 是 压 类 型 。 代 码 清 
单 3-10 展 示 了 空 枚 淮 的 一 种 用 法 。 

代码 清单 3-10: 衬 枚 举 的 用 法 〈 编 译 无 法 通过 ， 还 在 完善 中 ) 


1. enum Void {} 

2 fn main() { 

F let res: Result<u32, Void> = Ok(Q); 
4 let Ok (num) = res; 

3 } 


Rust 中 使 用 Result 类 型 来 进行 错误 人 处理， 强制 开发 者 处 理 Ok 和 Emr 两 
种 情况 ， 但 是 有 时 可 能 永远 没有 Err， 这 时 使 用 enum Void{f} 就 可 以 避免 
处 理 Err 的 情况 。 当 然 这 里 也 可 以 用 if let 语 句 处 理 ， 但 是 这 里 为 了 说 明 衬 
枚 举 的 用 法 故意 这 样 使 用 。 

但 是 可 惜 的 是 ， 当 前 版 本 的 Rust 还 不 支持 上 面 的 语法 ， 编 译 会 报 
销 。 不 过 Rust 团 队 还 在 持续 完善 中 ， 在 不 久 的 将 来 Rust 丈 会 文 持 此 用 
es 


撒 关 型 将 上 述 几 种 特殊 情况 纳入 了 闫 型 系统 ， 以 便 让 Rust 可 以 统一 
进行 处 理 ， 从 而 保证 了 类 型 安全 。 


3.2.2 类型 推导 


类 型 标注 在 Rust 中 属于 语法 的 一 部 分 ， 所 以 Rust 属 于 显 式 类 型 语 
言 。Rust 文 持 类 型 推断 ， 但 其 功能 并 不 像 Haskell 那 样 强 大 ，Rust 只 能 在 
Jey 4b Ve Fl A ve fT RA TEES 。 

iis 443-112 as 了 Rust 中 的 类 型 推导 。 

代码 清单 3-11: 类 型 推导 


ko FM usg; Be 232) => w32 í 
Es a + (b as u32) 

Se 了 

4. fnmain() { 

Fa let a = 1; 

6. let b = 2; 

We assert eq! (sum(a, D); 3); 
oe let elem = 5u8; 

os let mut vec = Vec::new(); 
LO vec.push (elem); 

Lf. assert eg! (vec, [5])} 

be d 


在 代码 清单 3-11 中 ， 第 5 行 和 第 6 行 声 明了 两 个 变量 a 和 b， 并 没有 标 
注 类 型 。 但 是 传 入 sum 函 数 中 却 可 以 正常 运行 ， 这 代表 Rust 目 动 推 导 了 a 
和 b 的 类 型 。 代 码 第 8 行 声 明了 一 个 u8 类 型 elem， 第 9 行 创建 了 一 个 空 的 
可 量 ， 类 型 为 Vec 二 _>， 可 以 通过 代码 清早 3-7 的 方法 来 查看 此 类 型 。 
第 10 行 用 push 方 法 将 elem 插 入 vec 中 ， 此 时 vec 的 类 型 为 Vec<u8> 。 

Turbofish 探 作 符 

当 Rust 无 法 从 上 下 文中 目 动 推导 出 类 型 的 时 候 ， 编 译 需 会 通过 错误 
信息 提示 你 ， 请 求 你 添加 次 型 标注 ， 代 人 码 清 单 3-12 展 示 了 这 种 情况 。 

代码 清单 3-12: Rust 无 法 根据 上 下 文 自动 推导 出 类 型 的 情况 


1 fn main() { 

2. isk. g = TIT 

2 Printlni!<(™{s?7}", *.parse () .linwrap())¢ 
4 } 


Aa ES 3-12, ezrin a P RIE o: 
error[E0284]: type annotations required 


| Prinktilnl ("{i2?}", x.parse () unwrap) } ; 


| BO LON EA, 


代码 清单 3-12 是 想 把 字符 串 " 1" 转换 为 整数 类 型 1， 但 是 parse 方 法 
其 实 是 一 个 泛 型 方法 ， 当 前 无 法 目 动 推导 类 型 ， 所 以 Rust 编 诺 器 无 法 确 
定 到 底 要 转换 成 哪 种 类 型 的 整数 ， 是 u32 还 是 i32 呢 ? 毕竟 Rust 中 整数 类 
型 很 丰富 。 所 以 这 里 就 需要 直接 给 出 明确 的 类 型 标注 信息 了 ， 如 代码 清 
单 3-13 所 示 。 

代码 清单 3-13: 添加 明确 的 类 型 标注 信息 


1 fn main() { 

2 let x = "1"; 

EP Lét int_x! 132 = X.PArSe (j. UNWTap)i 
| assert eg! (10E x, 1); 

5 } 


Rust 还 提供 了 一 种 标注 类 型 的 方法 ， 用 于 方便 地 在 值 表 达 式 中 和 直接 
标注 类 型 ， 如 代码 清 里 3-14 所 示 。 
代码 清单 3-14: 万 一 种 标注 区 型 的 方法 


1 fn main() { 

2 let x = "1"; 

ce assert @g!{ =x.parses:<132Z>(}.unwrap(), 1); 
4 } 


在 代码 清单 3-14 中 ， 使 用 了 parse: : <i32> O 这 样 的 形式 为 泛 
型 图 数 标注 类 型 ， 这 了 驶 避免 了 代码 清单 3-13 第 3 行 的 变量 声明 。 很 多 时 
候 并 不 需要 声 明太 多 变量 ， 代 人 码 看 上 去 也 能 更 加 案 浴 。 这 种 标注 类 型 
(: ; <> ) 的 形式 就 叫 作 turbofish 操 作 符 。 


FRE HES AS XE 

日 前 看 来 ，Rust 的 类 型 推 寻 还 不 够 强大 。 代 公 清 和 早 3-15 展 示 了 为 外 
一 种 类 型 推导 的 缺陷 。 

代码 清 蛙 3-15: 类 型 推导 缺陷 


ls Tn main() { 

2 let a = 0; 

Fa lat a POS = 4.38 POSILELVE()? 
4. } 


代码 清单 3-15 中 的 is_positive〈) 是 整数 类 型 实现 的 用 于 判断 正 负 的 
方法 。 但 是 当前 Rust 编 详 时 此 代码 会 出 现下 面 的 错误 : 

error[E0599]:no method named is_positive found for type {integer} in 
the current scope 

这 里 出 现 的 {integer} ”类 型 并 非 真 实 交 型， 它 只 是 被 用 于 错误 信息 
中 ， 表 明 此 时 编译 器 已 经 知道 变量 a 是 整数 类 型 ， 但 并 未 推导 出 变量 a 的 
真正 闫 型 ， 因 为 此 时 没有 足够 的 上 下 文 信 息 玫 助 编 详 莫 进行 推导 。 所 以 
在 用 Rust 编 程 的 时 候 ， 应 尽量 显 陈 声明 类 型 ， 这 样 可 以 避免 一 些 矿 烦 。 


3.3 yo 型 


iz AY (Generic) 2 —-FIBALS A. THA A Do SS BATH RR 
RAG, WD Tes. fa RU, EMEAK ERNS, 
FAAS ZR 74 it AY DASH RR A IR. PER ZA Box<T>.\ 
Option<T > 和 Result<T，E> 等 ， 都 是 泛 型 类 型 。 


3.3.1 yo AY pK aL 


BR EMR, IZA ATI en, PS 3-16 Be 
六 型 函数 的 示例。 

代码 清单 3-16: 泛 型 函数 

ka tn Loo<T> (x: T) => T ft 

recurn Xi 
} 
fn marin) { 

assert eq! (foo(1), 1); 

Assert eq! (reo("nellio"), “hel hoy; 


—7 oO, co & W N 


} 
也 可 以 在 结构 体 中 使 用 泛 型 ， 如 代码 清单 3-17 所 示 。 
代码 清单 3-17: 泛 型 结构 体 
j SeECwes Pointer > L1 x: E; wi T ] 

BARA MRA ERAS AZ PR SIL T> EH 。 
ZE RARER aS Ew FEW A SW ATE 
时 候 ， 也 需要 声明 泛 型 类 型 ， 如 代码 清单 3-18 所 示 。 

代码 清单 3-18: 为 泛 型 结构 体 实现 具体 方法 


le # [derive (Debug, PartialEgq) ] 

2 SFE Pormedi> Tee T, we T) 

3, impis I> Points 4 

4. th Hewa: LT, yi TT) => DeL 

i, POLULAK? Xy Vi Yt 

6. } 

F } 

8. EY MaL 

a, Let pointi = Portstnewitl, 2)3 

LU, DEE POLNE? = Points HEN (IT, Ts 

dei assert eg! (Pointl Polmnte: dy yt zr 
T2: assert Gal ipointe, Portions "Im: yi Trjg 
Los a 


注意 看 第 3 行 代码 中 的 impl<T>， 此 处 必须 声明 泛 型 T。Rust 标 准 
库 提供 的 各 种 容 右 类 型 大 多 是 江 型 类 型 。 比 如 同 量 Vec 二 TT 二 束 是 一 个 
泛 型 结构 体 ， 代 码 清单 3-19 展 示 了 其 在 Rust 源 码 中 的 实现 。 

Sis 3-19: 标准 库 中 的 Vec< 工 > 源码 


1 pub SELUCE Vee<T> { 
Z buf: RawVec<T>, 
Be len: usize, 
4 


} 


Rust 中 的 泛 型 属于 静 多 态 ， 它 是 一 种 编译 期 多 态 。 在 编译 期 ， 不 管 
是 泛 型 枚 举 ， 还 是 泛 型 函数 和 泛 型 结构 体 ， 都 会 被 单 态 化 
(Monomorphization ) “。 单 态 化 是 编译 堪 进 行 静 态 分 发 的 一 种 策略 。 
以 代 但 清单 3-16 中 的 泛 型 玫 数 为 例 ， 单 态 化 意味 着 编译 器 要 将 一 个 汉 型 
图 数 生 成 两 个 具体 类 型 对 应 的 函数 ， 人 代码 清单 3-16 等 价 于 代码 清单 3- 
20. 


UIA 3-20: Fn PES AS IZ A PR BY 


Fn toa ites 232) => G22 4 


return x; 


fn. foo ZARE & "Static. Str) => 4 static str f 


FeLUEn ss 


Oo Os nD Oo e W ND F 


= 
C= 


} 


沁 型 及 单 态 化 是 Rust 的 最 重要 的 两 个 功能 。 单 态 化 静态 分 有 的 好 处 
征 性 能 好 ， 没 有 运行 时 开销 ;上身 点 是 容 多 造成 编 详 后 生成 的 二 进 制 文 
IFEK 。 这 个 缺点 并 不 影响 使 用 Rust 编 程 。 但 是 需要 明白 单 态 化 机 制 ， 
在 平时 的 编程 中 注意 二 进 制 的 大 小 ， 如 末 变 得 太 大 ， 可 以 根据 具体 的 情 
况 章 构 代 人 码 来 解决 问题 。 


3.3.2 72 AIR EE Ae SS 


编 详 器 还 可 以 对 泛 型 进行 自动 推导 。 代 码 清 单 3-21 展示 了 对 泛 型 
返回 值 类 型 的 自动 推导 。 
代码 清单 3-21: 泛 型 返回 值 类 型 的 自动 推导 


lig # [derive (Debug, Partialkq) ] 
2, STEDET Soot az) Fy 

3 # [derive (Debug, PartialEq) ] 
4. struct Bar(acoz, L22] 4 

sP Harit Inst, { 

6. fn new(i: 132) -> Self; 
Ts } 

8. impi Inst for Feo { 

9. fn new(i: 132) -> Foo 1 
LU. Foo (1) 

«pba Fe } 

i J 

| el Jose for Bar 4 

14. fn new(i: 132) -> Bar | 
1.5. Bara, L + 10) 

16. } 

lie | 

LS... in POOMaArAT!: ISC: 1232) -> T 4 
a TS :new(1) 

20s 4} 

ole EN maing; i 

IEA let £: Foo = foobar(10); 
2S, assert eqi(L, Foeo(10)) ; 
24. let b: Bar = foobar (20); 
Cda assert eq! (by Bar (20 30))% 
26. | 


代码 清单 3-21 中 定义 了 两 个 元 组 结构 体 Foo 和 Bar， 分 别 为 它们 实现 
了 Inst trait 中 定义 的 new 方 法 。 然 后 定义 了 泛 型 函数 foobar， 以 及 函数 内 
调用 沁 型 TT 的 new 方 法 。 

代 人 码 第 22 行 调用 foobar 了 水 数 ， 并 指定 其 返回 值 的 类 型 为 Foo， 那 么 
Rust 束 会 根据 该 类 型 自动 推导 出 要 调用 Foo: : nnwy. HHE, RBF 
24 行 指定 了 foobar 孙 数 的 返回 值 应 该 为 Bar 类 型 ， 那 么 Rust 束 目 动 推导 出 
应 该 调用 Bar: : new 方 法 。 这 为 日 第 的 编程 种 来 了 尽 够 的 方便 。 


3.4 IR A trait 


可 以 说 trait 是 Rust 的 灵魂 。Rust 中 所 有 的 抽象 ， 比 如 接口 抽象 、 
OOP 泡 式 抽 象 、 函 数 式 范 陈 抽象 等 ， 均 基于 trait 来 完成 。 同 时 ，trait 也 
傈 证 了 这 些 抽象 几乎 都 是 运行 时 零 开 销 的 。 

HWA, BRITA trait? 从 次 型 系统 的 角 虔 来 说 ，trait 是 Rust 对 Ad- 
hoc 多 态 的 文 持 。 从 语义 上 来 说 ，trait 是 在 行为 上 对 类 型 的 约束 ， 这 种 约 
束 可 以 让 trait 有 如 下 4 种 用 法 : 

:接口 抽象 。 接 口 是 对 类 型 行为 的 统一 约束 。 

: 泛 型 约束 。 汉 型 的 行为 和 要 trait 限 定 在 更 有 限 的 范围 内 。 

` 抽象 类 型 。 在 运行 时 作为 一 种 间接 的 抽象 类 型 去 使 用 ， 动 态 地 分 
发 给 其 体 的 类 型 。 

标 窒 trait 。 对 类 型 的 约束 ， 可 以 直接 作为 一 种 “ 标 丛 ”使 用 。 

下 面 依 次 介绍 trait 的 这 4 种 用 法 。 


3.4.1 接口 抽象 


trait 最 基础 的 用 法 就 是 进行 接口 抽象 ， 它 有 如 下 特点 : 

接口 中 可 以 定义 方法 ， 并 文 持 默认 实现 。 

接口 中 不 能 实现 男 一 个 接口 ， 但 是 接口 之 间 可 以 继承 。 

同一 个 接口 可 以 同时 和 被 多 个 类 型 实现 ， 但 不 能 被 同一 个 美 型 实现 

BAR 

使 用 impl 关 键 字 为 类 型 实现 接口 方法 。 

使 用 trait 关 键 字 来 定义 接口 。 

图 3-2 形 象 地 展示 了 trait 接 口 抽象 。 
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图 3-2: trait 作 为 接口 抽象 的 形象 表示 
在 第 2 章 的 代码 清单 2-53 中 定义 的 Fly trait 就 是 一 个 典型 的 接口 抽 
象 。 类 型 Duck 和 Pig 均 实现 了 该 trait， 但 具体 的 行为 各 不 相同 。 这 正 是 一 
种 Ad-hoc 多 态 : 同一 个 trait， 在 不 同 的 上 下 文中 实现 的 行为 不 同 。 为 
不 同 的 类 型 实现 trait， 属 于 一 种 函数 重 载 ， 也 可 以 说 函数 重 载 束 是 一 种 
Ad-hoc 多 态 。 
FRR A 
事实 上 ，Rnust 中 的 很 多 操作 符 都 是 基于 trait 来 实现 的 。 比 如 加 法 损 
作 符 瓯 是 一 个 trait， 加 法 操作 不 仅 可 以 针对 整数 、 浮 点 数 ， 也 可 以 针对 
“OTF AB 
那么 如 何 对 这 个 加 法 操作 进行 抽象 呢 ? 除 了 两 个 相 加 的 值 的 类 型 ， 
还 有 返回 值 类 型 ， 这 三 个 类 型 不 一 定 相 同 。 我 们 首先 能 想到 的 一 个 方法 
rez A iz Htrait, Wa 3-22 Ata o 
代码 清单 3-22: 利用 泛 型 trait 实 现 加 法 抽象 
thes trait Add<RHS, Output > { 
2 in aada (self; rns: RHS) => Output; 
3. } 
4 ml AGI<2.32, 132> for 132 4 


fn my add(self, 二 1.37) => f9 f 
self + rhs 


} 
JM] Add<u32, 132> for WUJA í 


wk Lh my ddd(selitT, Bae: Us2) -7 IL 4 
LL LS + Bd ) as 152 

dz } 

Te | 

14. fn main() { 

i A ler, (4, ©, Br @) = (lise, 2132, 2032, 41132)? 
16. let x: 132 = a.my add(b); 

I7; let y: 132 = Gamy add(a); 

18. assert €q! (Xy 3132) 2 

1 9. assert. eqily, L132)3 

2 4} 


代码 清单 3-22 中 定义 了 Add trait。 它 包含 了 两 个 类 型 参数 : RHS 和 
Output， 分 别 代表 加 法 操作 人 符 右 侧 的 类 型 和 返回 值 的 类 型 。 在 该 trait 内 
定义 的 add 方 法 签名 中 ， 以 self 为 参数 ， 代 表 实 现 该 trait 的 类 型 。 

接 下 来 为 让 2 和 u32 类 型 分 别 实现 了 Add trait. 

代码 第 4 行 到 第 8 行 表示 为 132 类 型 实现 Add， 并 日 要 求 只 能 和 i32 类 
型 相 加 ， 且 返回 值 也 是 i32 类 型 。 

代码 第 9 行 到 第 13 行 表示 为 u32 类 型 实现 Add， 并 且 要 求 只 能 和 u32 
类 型 相 加 ， 但 是 返回 值 是 i32 类 型 。 

然后 在 main 函 数 中 分 别 声 明了 i32 和 u32 两 组 数字 ， 分 别 让 其 相 加 ， 
得 到 了 预期 的 结 

使 用 trait 沁 型 来 实现 加 法 抽象 ， 看 上 去 好 像 没 什么 问题 ， 但 是 仔细 
考虑 一 下 ， 束 会 发 现 它 有 一 个 很 大 的 问题 。 一 般 来 说 ， 对 于 加 法 操作 要 
考虑 以 下 两 种 情况 : 

基本 数据 类 型 ， 比 如 i32 和 i32 类 型 相 加 ， 出 于 安全 考虑 ， 结 果 必 人 然 


还 是 i132 类 型 。 


也 可 以 对 字符 串 进 行 加 法 操作 ， 但 是 Rust 中 可 以 动态 增加 长 度 的 

只 有 String 关 型 的 字符 串 ， 所 以 一 般 是 String 关 型 的 才 会 实现 Add， 其 返 
回 值 也 必须 是 String 类 型 。 但 是 加 法 操作 符 右 侧 也 可 以 是 字符 串 字 面 
量 。 所 以 ， 面 对 这 种 情况 ，String ”的 加 法 操作 还 必须 实现 Add 二 &str， 
String > o 

不 管 是 以 上 两 种 情况 中 的 哪 一 种 ，Add 的 第 二 个 类 型 参数 总 是 显得 
有 点 多 余 。 所 以 ，Rust 标 准 库 中 定义 的 Add trait 使 用 了 另外 一 种 与 法 。 

代码 清单 3-23 展 示 了 Rust 标 准 库 中 Add trait 的 定义 。 

代码 清单 3-23: 标准 库 Add trait 的 定义 

l. pub trait Add<RHS = Self> { 

2 type Output; 

ar in adada(seslf; rhe: RHS) => Self: sQutput; 

4, } 


代码 清单 3-23 中 同样 使 用 了 泛 型 trait， 但 是 与 代码 清单 3-22 的 区 别 
在 于 ， 它 将 之 前 的 第 二 个 类 型 参数 去 反 了 了 。 取 而 代 之 的 是 type 定 义 的 
Output， 以 这 种 方式 定义 的 英 型 叫 作 关 联 类 型 。 而 Add<RHS=Self> 这 
种 形式 表示 为 类 型 参数 RHS 指 定 了 默认 值 Self。Self 是 每 个 trait 都 带 有 的 
隐 式 类 型 参数 ， 代 表 实 现 当前 trait 的 具体 类 型 。 

当代 码 中 出 现 操 作 符 “+” 的 时 候 ，Rust 就 会 自动 调用 操作 符 左 侧 的 
操作 数 对 应 的 add O 方法 ， 去 完成 具体 的 加 法 操作 ， 也 束 是 说 “+” 操 作 
与 调用 add() 方法 是 等 价 的 ， 如 图 3-3 所 示 。 





图 3-3: “+ 操作 等 价 于 调用 add〈) 方法 


代码 清单 3-24 展 示 了 标准 库 中 为 u32 类 型 实现 Add trait 来 定义 加 法 的 
VI, ASR, KEM SHER DANAE. 
代 公 清单 3-24: 标准 库 中 为 u32 关 型 实现 Add trait 
1 impl Add for St | 
2 type Output = St; 
As fn add(self, other: St) => St { self + other } 
4 } 


因为 Rust 源 码 为 u32 实 现 Add trait 的 操作 是 用 宏 来 完成 的 ， 所 以 代码 
消 里 3-24 中 出 现 了 $t 这 样 的 从 号 ， 在 第 12 半 会 讲 到 天 于 宏 的 更 多 细 市 。 
当前 这 里 的 $t 可 以 看 作 u32 类 型 ， 如 代码 清单 3-25 所 示 。 

代码 清单 3-25: 可 以 将 上 面 的 $t 看 作 u32 类 型 

1 impl Add for u32 { 

2 type Output = u32; 

EF fn add(self, other: u32) -> u32 { self + other } 
4 } 

这 里 的 关联 类 型 是 32， 因 为 两 个 u32 整 数 相 加 结果 必然 还 是 u32 整 
数 。 如 果实 现 Add trait 时 并 未 指明 沁 型 参数 的 具体 类 型 ， 则 默认 为 Self 类 
型 ， 也 就 是 u32 类 型 。 

除了 整数 ，String 类 型 的 字符 串 也 支持 使 用 加 号 进行 连接 。 代 码 清 
单 3-26 展 示 了 为 String 类 型 实现 Add trait 的 源码 。 同 样 ， 为 了 突出 重点 ， 
我 们 进行 了 删 减 。 

代码 清单 3-26: 标准 库 中 为 String 类 型 实现 Add trait 


1 impl Add<&str> for String { 

2 type Output = String; 

3 tn adad imut self; ether: tstri => String 4 
4. selft.push str({other); 

3 self 

6 } 

/ } 


代码 清单 3-26 中 的 impl Add 二 &str 二 指明 了 泛 型 类 型 为 &str， 并 没有 
使 用 Self 默 认 类 型 参数 ， 这 表明 对 于 String 类 型 字符 串 来 说 ， 加 号 右 侧 的 


值 类 似 &str 类 型 ， 而 非 String 类 型 。 关 联 类 型 Output 指 定 为 String 类 型 ， 
意味 看 加 法 返回 的 是 String 类 型 。 代 人 码 清 单 3-27 展 示 了 String 字符 串 的 加 
EIS Fe 

代码 清单 3-27: String 类 型 字符 串 的 加 法 运算 


L fn main() { 

2. let a = "hello"; 

an let b = ™ world"; 

4. let © = mto BEng () + Be 

5. printin! ("ye €) 77 “hello world” 


6. } 


在 代码 清单 3-27 中 ， 变 量 a 和 Pb 为 &str 类 型 ， 所 以 将 二 者 相 加 时 ， 必 
须 将 a 转换 为 String 类 型 。 

综 上 所 述 ， 使 用 关联 类 型 能 够 使 代码 变 得 更 加 精简 ， 同 时 也 对 方法 
的 输入 和 输出 进行 了 很 好 的 隔离 ， 使 得 代码 的 可 讯 性 大 大 增强 。 在 语义 
层面 上 ， 使 用 关联 类 型 也 增强 了 trait 表 示 行 为 的 这 种 语义 ， 因 为 它 表 
In I MENITI (trait) 相关 联 的 类 型 。 在 工程 上 ， 也 体现 出 了 高 内 
聚 的 特点 。 

trait 一 致 性 

既然 Add 是 trait， 那 么 就 可 以 通过 impl Add 的 功能 来 实现 操作 符 重 载 
的 功能 。 在 Rust 中 ， 通 过 上 面 对 Add trait 的 分 析 就 可 以 知道 ，u32 和 u64 
类 型 是 不 能 直接 相 加 的 。 代 码 清 单 3-28 尝 试 重 载 整数 的 加 法 操作 ， 实 现 
u32 和 u64 类 型 下 接 相 加 。 

代码 清单 3-28: 和 尝试 重 载 整数 的 加 法 操作 


use std::ops: :Add; 
impl Add<uo4> for u32{ 
type Output = u64; 
tn addad(selfr, other: wed) => Self? Output {| 
(self as u64) + other 


} 
fn main() { 
let a = 1u32; 
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10. let b = 2u64; 
Li assert eq! (atb, 3); 
LZ, } 


代码 清单 3-28 编 译 会 出 错 : 
error[E0117]: only traits defined in the current crate can be implemented 
for arbitrary types 


XE ANRA — KEAN A: PRL] (Orphan Rule) . 
孤儿 规则 规定 ， 如 果 要 实现 某 个 trait， 那 么 该 trait 和 要 实现 该 trait 的 那 
个 类 型 至 少 有 一 个 要 在 当前 crate 中 定义 。 在 代码 清单 3-28 中 ，Add trait 
和 u32、u64 都 不 是 在 当前 crate 中 定义 的 ， 而 是 定义 于 标准 库 中 的 。 如 采 
没有 孤儿 规则 的 限制 ， 标 准 库 中 u32 类 型 的 加 法 行为 就 会 被 破坏 性 地 改 
写 ， 导 致 所 有 使 用 u32 类 型 的 crate 可 能 产生 难以 预料 的 Bug。 

因此 ， 要 想 正 第 编 诺 通过 ， 残 需要 把 Add trait 放 到 当前 crate 中 来 定 
义 ， 如 代码 清单 3-29 所 示 。 

代码 清单 3-29: 在 当前 crate 中 定义 Add trait 


trait Add<RHS=Self> { 
type Output; 
fi adad(selt, LHS; RAES) -> Sells Ouceut; 
} 
impl Add<u6o4> for u32{ 
type Output = u64; 
tn aGd(self, dather: Doa) -> SelissOnueEpute 4 
(self as u64) + other 
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} 


in main) 4 


= H 
= oO 


Lda bet a = Mo 

13; lee b = 2647 

14. assert Egi (6-000450); 313 
L5. 1 


代码 清单 3-29 在 当前 crate 中 定义 了 Add trait， 这 样 就 不 会 违反 孤儿 
规则 。 并 且 在 imnpl Add 的 时 候 ， 将 RHS 和 关联 类 型 指定 为 u64 类 型 。 注 
意 在 调用 的 时 候 要 用 add， 而 非 操 作 符 +， 以 避免 航 Rust 识 别 为 标准 库 中 
的 add 实 现 。 这 样 束 可 以 正常 编译 通过 了 ，。 

当然 ， 除 了 在 本 地 定义 Add trait 这 个 方法 ， 还 可 以 在 本 地 创建 一 个 
新 的 类 型 ， 然 后 为 此 新 类 型 实现 Add， 这 同样 不 会 违反 孤儿 规则 ， 如 代 
码 清单 3-30 所 示 。 

代码 清单 3-30: 为 新 类 型 实现 Add 操 作 


use std::ops::Add; 
# [derive (Debug) ] 
struct Point 4 


impl Add for Point { 
type Output = Point; 
fn add(self, other: Point) -> Point { 
Point { 


ge self; + Otor: &, 


Oo me =] oF Oo me Le Bo e 
< 
上 
Oo 
NO 


S. (2 “Es 
INO e OO 


VE BELT.Y + Othet.y; 


Loe. -| 
16. fn main() { 
ity Ii Point. 12i 3, yi 3 
18. oramne eee Fee | wt by wid |} Boe | me 2, wi 8 7): 
19, } 

还 需要 注意 ， 关 联 类 型 Output 必 须 指定 具体 类 型 。 函 数 add 的 返回 
类 型 可 以 写 Point， 也 可 以 写 Self， 也 可 以 写 Self: : Output. 

traitk 7 

Rust 不 文 持 传统 面 问 对 象 的 继承 ， 但 征文 持 trait 继 到 。 子 traitH 以 
继承 父 trait 中 定义 或 实现 的 方法 。 在 日 钊 编程 中 ，trait 中 定义 的 一 些 行 
为 可 能 会 有 重复 的 情况 ， 使 用 trait 继 承 可 以 简化 编程 ， 方 便 组 合 ， 让 代 
但 更 加 优美 。 

接 下 来 以 Web 编 程 中 常见 的 分 页 为 例 ， 来 说 明 trait 继 承 的 一 些 应 用 
场景 。 代 查 清单 3-31 以 分 页 为 例 展示 了 如 何 定 义 trait。 

代码 清单 3-31: 以 分 页 为 例 定 义 trait 


trait Page{ 
fn set page (self, p: 132) 
printin! ("Page Default: 1"); 


} 
trait PerPage { 
fn set perpage(&self, num: 132) { 
println! ("Per Page Default: 10"); 
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te <7 

11. struct MyPaginate{ page: 132 } 
12. impl Page for MyPaginate{ } 

13. impl PerPage for MyPaginate{} 
IA. £n Maar) + 


LD. Let my paginate = MyPaginateipage: 1}; 
16. ily paginate.set page (2); 

i my paginate.set. perpage (100); 

LS. ] 


代码 清单 3-31 中 定义 了 Page 和 PerPage 两 个 trait， 分 别 代表 当前 页 面 
的 页码 和 每 页 显示 的 条 目 数 。 并 且 分 别 实现 了 两 个 献 认 方法 : set_page 
和 set_perpage， 分 别 用 于 设置 当前 页 面 页 人 码 和 每 页 显示 条 有 目 数 ， 上 默认 值 
被 设置 为 了 第 1 页 和 每 页 显示 10 个 条 月 。 

RAS LAT FE SC 了 MyPaginate 结 构 体 。 

代码 第 12 行 和 第 13 行 分 别 为 MyPaginate 实 现 了 Page 和 PerPage， 使 用 
空 的 impl 块 代表 使 用 trait 的 献 认 实现 。 

在 代码 第 14 行 到 第 18 行 的 main 函 数 中 ， 创 建 了 MyPaginate 的 一 个 实 
例 my_paginate， 并 分 别 调 用 set _ page 和 set_perpage 方 法 ， 输 出 结果 为 默 
WE o 

假如 此 时 需要 多 加 一 个 功能 ， 要 求 可 以 设置 直接 跳 转 的 页 面 页 码 ， 
为 了 不 影响 之 前 的 代码 ， 可 以 使 用 trait 继 承 来 实现 ， 如 代码 清单 3-32 上 所 
ZIN o 

代码 清单 3-32: 使 用 trait 继 承 扩 展 功 能 


trait Paginate: Page + PerPage { 
fn set skip page(eself, num: 132) { 


} 
} 


1 
2 
3. prantin! ("Skip Page = {2?7}™", mum); 
4 
5 
6 impl <T: Page + PerPage>Paginate for T{} 


Mis 3-32 FE X sf Paginate, HEH E So ean Afietrait. R 
伺 中 Page+PerPage 表 示 Paginate 同 时 继承 了 Page 和 PerPage 这 两 个 trait。 总 
体 来 说 ，trait 名 后 面 的 冒号 代表 trait 继 承 ， 其 后 跟随 要 继承 的 父 trait 名 
称 ， 如 果 是 多 个 trait 则 用 加 号 相连 。 

代码 第 6 行为 沁 型 T 实 现 了 Paginate， 并 且 包 括 空 的 impl 块 。 整 行 代 
但 的 意思 是 ， 为 所 有 拥有 Page 和 PerPage 行 为 的 类 型 实现 Paginate。 

然后 就 可 以 使 用 set_skip_page 方 法 了 ， 如 代码 清单 3-33 所 示 。 

代码 清单 3-33: 调用 set_skip_page 方 法 

fn main() { 


let my paginate = MyPaginate{page: 1}; 


my paginate.set perpage (100); 


a; 

2 

3 my paginate.set page(l); 

4 

5 My paginate.set skip page (12); 
6 


} 


在 代码 清单 3-33 中 ， 我 们 和 且 接 调用 了 set_skip_page 方法 ， 而 不 会 
影 啊 之 前 的 代码 。 另 外 ，trait 继 承 也 可 以 用 于 扩展 标准 库 中 的 方法 。 


3.4.2 泛 型 约束 


使 用 泛 型 编程 时 ， 很 多 情况 下 的 行为 并 不 是 针对 所 有 类型 都 实现 
的 ， 代 码 清 单 3-34 所 示 的 泛 型 求 和 函数 就 是 这 样 一 个 例子 。 
代码 清单 3-34: 泛 型 求 和 函数 
im rn sumsI> {as T D3 Ty4 
Ze at+b 
3. } 


MAP, MRS 3-34 的 sum RAL AWARE AA 
整数 ， 那 么 加 法 行为 是 合法 的 。 如 末 传 入 的 参数 是 两 个 字符 串 ， 理 论 上 
也 应 该 是 合法 的 ， 加 法 行为 可 以 是 字符 串 相 连 。 但 是 假如 传 入 的 两 个 参 
Be MAF AT, Boa MBO AiR, EAA. APD BES 
ECE AP HH IH o 

那么 ， 如 何 修正 呢 ? 答案 是 ， 用 trait 作 为 泛 型 的 约束 。 

trait 定 

对 于 代码 清单 3-34 中 的 求 和 函数 来 说 ， 只 要 两 个 参数 是 可 相 加 的 类 
型 就 可 以 ， 如 代码 清单 3-35 所 示 。 
代码 清单 3-35: 修正 沁 型 求 和 函数 

use std::ops: Addi 

in, Su Ada<t, Output=T>> ta: Ty 5: T) => TH 
a+r D 

} 


Ln Hien () { 
assert eq! (sum(lu3zZ, 2u3Zz), 3); 
assert eq! (sum(1u64, 2u64), 3); 
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在 代码 清单 3-35 中 ， 我 们 使 用 二 T: Add<T, Output=T> > xyz AY 
进行 了 约束 ， 表 示 sum 函 数 的 参数 必须 实现 Add trait， 并 且 加 号 两 边 的 
类型 必须 一 致 。 这 里 值得 注意 的 是 ， 对 泛 型 约束 的 时 候 ，Add<T， 
Output=T 之 通过 关 型 参数 确定 了 关联 闫 型 Output 也 是 IT， 也 可 以 省 略 交 
型 参数 T， 直 接 写 为 Add<Output=T>。 

如 果 该 sum 函数 传 入 两 个 String 类 型 参数 ， 就 会 报错 。 因 为 String 字 
符 串 相 加 时 ， 右 边 的 值 必须 是 &str 类 型 。 所 以 不 满足 此 sum 函 数 中 Add 
trait 的 约束 。 

使 用 trait 对 泛 型 进行 约束 ， 叫 作 trait 限 定 (trait Bound ) 。 格 式 
如 下 : 


fn gerneric<T;: MyTrait + MyOtherTrait + SomesStandardTrait>(ts I) {} 


iz AL PRE ZA BRIAN Bae: 需要 一 个 类 型 T， 并 且 访 类 型 T 
必须 实现 ”MyTrait、MyOtherTrait 和 SomeStandardTrait 中 定义 的 全 部 方 


VE, A REED iz AY RAN. 

理解 trait 限 定 

trait 恨 定 的 思想 与 Java 中 的 汉 型 限定 、Ruby 和 Python 中 的 Duck 
Typing 、Golang 中 的 Structural Typing 、Elixir 和 Clojure 中 的 Protocol 
都 很 相似 。 所 以 有 编写 这 些 编程 语言 经 验 的 开 及 者 看 到 trait 限 定 会 党 得 
很 熟悉 。 在 类 型 理论 中 ，Structural Typing 是 一 种 根据 结构 来 判断 类 型 是 
BENERE, MAW RABY. Duck Typing、Protocol 都 是 
Structural Typing 的 变种 ， 一 般 用 于 动态 语言 ， 在 运行 时 检测 类 型 是 售 等 
价 。Rust 中 的 trait 限 定 也 是 Structural Typing 的 一 种 实现 ， 可 以 看 作 一 种 
静态 Duck Typing 。 

从 数学 角度 来 理解 trait 限 定 可 能 更 加 直观 。 类 型 可 以 看 作 具 有 相同 
属性 值 的 集合 。 当 声明 变量 let x: u32 时 ， 意 味 看 xEu32， 也 就 是 膏 ，xX 
属于 u32 集 合 。 可 以 再 来 回顾 一 下 代码 清单 3-32 中 声明 的 trait: 

trait Paginate: Page + PerPage 
trait 也 是 一 种 类 型 ， 是 一 种 方法 集合 ， 或 者 说 ， 是 一 种 行为 的 集 


S 。 它 的 意思 是 ，PaginateC (PagenPerpage) ，Paginate 集 合 是 Page 和 
Perpage 交 集 的 子 集 ， 如 图 3-4 所 示 。 


| Paginate 





图 3-4: Paginate 集 合 包 含 于 Page 和 Perpage 集 合 的 交集 中 
由 此 可 以 得 出 ，Rust 中 冒号 代表 集合 的 “包含 于 ?关系 ， 而 加 号 则 代 
表 交 集 。 所 以 下 和 面 这 种 写法 : 
Lm A + B> © ior T 
可 以 解释 为 “为 所 有 TC (AnB) 实现 Trait C”， 如 图 3-5 所 示 。 


图 3-5: 为 所 有 TC (AnB) 实现 Trait C 

Rust 编 程 的 哲学 是 组 合 优 于 继承 ”，Rust 并 不 提供 类 型 层面 上 的 继 
承 ，Rust 中 所 有 的 类 型 都 是 独立 和 存在 的 ， 所 以 Rust 中 的 类 型 可 以 看 作 语 
言 人 允许 的 最 小 集合 ， 不 能 再 包含 其 他 子 集 。 而 trait 限 定 可 以 对 这 些 类 型 
集合 进行 组 合 ， 也 就 是 求 交 集 。 

ELAN KUL, trait 限定 给 予 了 开 友 者 更 大 的 上 自由 上 度 ， 因 为 不 再 需要 类 
型 间 的 继 了 闲 ， 也 人 徐 化 了 编译 器 的 检查 操作 。 包 含 trait 限 定 的 泛 型 属于 静 
态 分 及， 在 编 诺 期 通过 单 态 化 分 别 生 成 具体 次 型 的 实例 ， 所 以 调用 trait 
限定 中 的 方法 也 都 是 运行 时 零 成 本 的 ， 因 为 不 需要 在 运行 时 再 进行 方法 
ET FX 

如 有 末 为 泛 型 增加 比较 多 的 trait 限 定 ， 代 码 可 能 会 变 得 不 太 易 谈 ， 比 
如 下 和 面 这 种 写法 : 

Ey toee<Ts A, Bt BC, Bs Detar Te BE Be CE Billi ral 

Rust 提 供 f where = ， 用 来 对 这 种 情况 进行 重 构 : 

if, LOOT, EK; Rela: T Bi KR; ©: K) where T: Ay Ki Bre, Bi BD tw « «] 


这 样 重 构 之 后 ， 代 码 的 可 读 性 就 提高 
3.4.3 抽象 类 型 


trait 还 可 以 用 作 抽 和 象 类 型 (Abstract Type ) 。 抽 象 类 型 属于 类 型 
系统 的 一 种 ， 也 叫 作 存在 类 型 〈Existential Type ) 。 相 对 于 具体 类 型 
而 言 ， 抽 象 类 型 无 法 直接 实例 化 ， 它 的 每 个 实例 都 是 基体 类 型 的 实例 。 

对 于 抽象 英 型 而 言 ， 编 详 夯 可 能 无 法 确定 其 确切 的 功能 和 所 占 的 衬 
HKD. HMA Rust 目 前 有 两 种 方法 来 处 理 抽象 类 型 : trait 对 象 和 impl 
Trait 。 


traitX} % 


在 泛 型 中 使 用 trait 限 定 ， 可 以 将 任意 闫 型 的 范围 根据 类 型 的 行为 限 
定 到 更 精确 可 控 的 范围 内 。 从 这 个 角度 出 发 ， 也 可 以 将 共同 拥有 相同 行 
为 的 类 型 集合 抽象 为 一 个 类 型 ， 这 束 是 trait 对 象 (trait Object) . “对 
象 ” 这 个 词 来 自 面 问 对 象 编 程 语言 ， 因 为 trait 对 象 是 对 具有 相同 行为 的 一 
组 具体 类 型 的 抽象 ， 等 价 于 面 同 对 象 中 一 个 封装 了 行为 的 对 象 ， 所 以 称 
其 为 trait 对 象 。 

代码 清单 3-36 对 比 了 trait 限 定 和 trait 对 象 的 用 法 。 

代码 清单 3-36: trait 限 定 和 trait 对 象 的 用 法 比较 


ls, # [derive (Debug) ] 

Zi SEruct Foo; 

5. Crait Bar 4 

4. fn baz(&self); 

SA } 

6. impl Bar for Foo { 

F. Th paz (ssel) { Bertini I self) } 
8. } 

J. fn static dispaáteb<i> (ts CN) where IsBar 1 
LỌ: t,a2Z () 7 

EE 4 

LZ. fü dynamic dispaten(t? «Bar) | 

Le Ga 

14. } 

ls YE maini) 4 

L. let foo = Foo; 

LT, Static. dispatch (&foo) ; 

LS. dynamic dispatch (&foo) ; 

ley Ct 


代码 清单 3-36 中 定义 了 结构 体 Foo 和 Bar trait， 并 且 为 Foo 实 现 了 
Bar。 

代码 第 9 行 到 第 14 行 分 别 定 义 了 市 trait 限 定 的 泛 型 另 数 staitc_dispatch 
和 使 用 trait 对 象 的 dynamic_dispatch 上 函数 。 

代码 第 15 行 到 第 19 行 分 别 调用 了 static_dispatch 和 dynamic_dispatch 


图 数 。static_dispatch 征 属于 静态 分 及 的 ， 参 数 t 之 所 以 能 调用 baz 77 
法 ， 是 因为 Foo 类 型 实现 了 Bar。dynamic_dispatch 是 属于 动态 分 发 的 ， 
参数 t 标 注 的 类 型 &Bar 是 trait 对 象 。 那 么 ， 什 么 是 动态 分 发 呢 ?” 它 的 工作 
机 制 是 怎样 的 呢 ? 

trait 本 吴 也 十 一 种 类型 ， 但 它 的 类 型 大 小 在 编译 期 是 无 法 确定 的 ， 
所 以 trait 对 象 必须 使 用 指针 。 可 以 利用 引用 操作 人 符 & 或 Box< 工 > 来 制造 
一 个 trait MA. trait 对 象 等 价 于 代码 清单 3-37 所 示 的 结构 体 。 

代码 清单 3-37: 等 价 于 trait 对 象 的 结构 体 


1. pub struct TrALtOa ect 9 
Pn pub data: “mut (), 

3: pub vtable: *mut (), 
4. } 


代码 清单 3-37 的 结构 体 TraitObject 来 目 Rust 标 准 库 ， 但 它 并 不 能 代 
表 真 正 的 trait 对 象 ， 它 仅仅 用 于 操作 撒 层 的 一 些 Unsafe 代码 。 这 里 使 用 
该 结构 体 只 是 为 了 用 它 来 帮助 理解 trait 对 象 的 行为 。 

TraitObject ”包括 两 个 指针 : data 指 针 和 vtable 指 针 > impl 
MyTrait for 本 为 例 ，data 指 针 指 问 trait 对 象 保存 的 类 型 数据 T, vtable 指 
针 指 同 包含 为 实现 的 MyTrait 的 Vtable (Virtual Table) ， 访 名 称 来 
源 于 C++， 所 以 可 以 称 之 为 虚 表 。 虚 表 的 本 质 是 一 个 结构 体 ， 包 含 了 析 
构 函 数 、 大 小 、 对 齐 和 方法 等 信息 。TraitObject 的 结构 如 图 3-6 所 示 。 


TraitObject 





图 3-6: TraitObject 结 构 示意 

在 编译 期 ， 编 详 绒 只 知道 TraitObject 包 含 指针 的 信息 ， 并 且 指 针 的 
大 小 也 是 确定 的 ， 并 不 知道 要 调用 哪个 方法 。 在 运行 期 ， 当 有 
trait_object.method () 方法 被 调用 时 ，TraitObject 会 根据 虚 表 指针 从 虚 
表 中 查 出 正确 的 指针 ， 然 后 再 进行 动态 调用 ”。 这 也 是 将 trait 对 象 称 为 
动态 分 友 的 原因 。 

所 以 ， 当 代码 清单 3-36 中 的 dynamic_dispatch (&foo) 函数 在 运行 
期 航 调用 时 ， 会 先 去 租 虚 表 ， 取 出 相应 的 方法 tbaz O ， 然 后 调用 。 

讲 到 trait 对 象 时 ， 我 们 需要 特别 讲 一 下 对 象 安 全 的 问题 。 

并 不 是 每 个 trait 都 可 以 作为 trait 对 象 航 使 用 ， 这 依旧 和 类 型 大 小 是 
含 确定 有 关系 。 每 个 trait 都 包含 一 个 隐 坏 的 类 型 参数 Self， 代 表 实 现 议 
trait 的 次 型 。Self 默 认 有 一 个 隐 却 的 trait 限 定 ? Sized， 形 如 二 Self: ? 
Sized>, ? Sized trait 包括 了 所 有 的 动态 大 小 类 型 和 所 有 可 确定 大 小 的 
KAJ, Rut ”中 大 部 分 类 型 都 默认 是 可 确定 大 小 的 类 型 ， 也 了 吏 是 二 工 : 
Sized 之 ， 这 也 是 泛 型 代码 可 以 正 营 编译 的 原因 。 

当 trait 对 象 在 运行 期 进行 动态 分 及 时 ， 也 必须 确定 大 小 ， 人 否则 无 法 
为 其 正确 分 配 内 存 空间 。 上 所 以 必须 同时 满足 以 下 两 条 规则 的 trait 才 可 以 
作为 trait 对 象 使 用 。 


:trait 的 Self 关 型 参数 不 能 被 限定 为 Sized。 

:trait 中 所 有 的 方法 都 必须 是 对 象 安全 的 。 

满足 这 两 条 规则 的 trait 融 是 对 象 安全 的 trait。 那 么 ， 什 么 是 对 象 安 
ANE? 

trait 的 Self 关 型 参数 绝 大 部 分 情况 默认 是 ? Sized ， 但 也 有 可 能 出 现 
锌 限定 为 Sized 的 情况 ， 如 代码 清单 3-38 所 示 。 

代码 清单 3-38: 标记 为 Sized 的 trait 

1. trait Foo: Sized { 


7A fn some method (&self); 
3. } 


代码 清单 3-38 中 的 Foo 继 承 自 Sized， 这 表明 ， 要 为 某 类 型 实现 Foo， 
必须 先 实现 Sized。 所 以 ，Foo 中 的 隐 式 Self 也 必然 是 Sized 的 ， 因 为 Self 
代表 的 是 那些 要 实现 Foo 的 类 型 。 

按 规则 一 ，Foo 不 是 对 象 安全 的 。trait 对 象 本 身 是 动态 分 发 的 ， 编 译 
期 根本 无 法 确定 Self 具 体 是 哪个 类 型 ， 因 为 不 知道 给 哪些 类 型 实现 过 该 
trait, 更 无 法 确定 其 大 小 ， 现 在 义 要 求 Self 古 可 人 确定 大 小 的 ， 这 束 造 束 
了 图 3-7 所 示 的 薛 定 廖 的 类 型 : 既 能 确定 大 小 又 不 确定 大 小 。 





图 3-7: BEE SSS AY 


当 把 trait 当 作对 象 使 用 时 ， 其 内 部 类 型 束 默 认为 Unsize 类 型 ， 也 束 
是 动态 大 小 类 型 ， 只 是 将 其 置 于 编 详 期 可 人 确定 大 小 的 胖 指 针 背 后 ， 以 供 
运行 时 动态 调用 。 对 和 象 安全 有 的 本 质 就 是 为 了 让 trait 对 象 可 以 安全 地 调用 
相应 的 方法 。 如 果 给 trait 加 上 Self: Sized 限 定 ， 那 么 在 动态 调用 trait 对 象 
的 过 程 中 ， 如 果 磁 到 了 Unsize 类 型 ， 在 调用 相应 方法 时 ， 可 能 引发 段 错 


tro MA, mie ANirait tT RA. KIRK, 4AM EtraittE AtraitX} 
象 时 ， 可 以 使 用 Self Sized 进 行 限定 。 

而 对 象 安全 的 方法 必须 满足 以 下 三 点 之 一 。 

方法 受 Self: Sized 约束 。 

TESS EDR = 

> UMEREZ ESA. WREE RZE, trait ”对 象 在 虚 表 
(Vtable ) FÆRDER KY AE TZ Val FB -S YE 

> 第 一 个 参数 必须 为 Self 类 型 或 可 以 解 引用 为 Self 的 类 型 (也 就 
是 说 ， 必 须 有 接收 者 ， 比 如 self、&self、&mut self 和 self: Box<Self 
>， 没 有 接收 者 的 方法 对 trait 对 象 来 说 坚 无 意义 ) 。 

> Self 不 能 出 现在 除 第 一 个 参数 之 外 的 地 方 ， 包 括 返回 值 中 。 这 是 
因为 如 果 出 现 Seljf， 那 吏 意 味 看 Self 和 self、&self 或 &mnut selfH) 2874 AVL 
配 。 但 是 对 于 trait 对 象 来 说 ， 根 本 无 法 做 到 保证 类 型 匹配 ， 因 此 ， 这 种 
情况 下 的 方法 是 对 象 不 安全 的 。 

这 三 点 可 以 尽 结 为 一 句 话 : 没有 额外 Self 类 型 参数 的 非 汉 型 成 员 方 
ee 

.trait 中 不 能 包含 关联 常量 (Associated Constant) 。 在 Rust 2018} 
本 中 ，trait 中 可 以 增加 默认 的 关联 和 常量 ， 其 定义 方法 和 关联 类 型 卉 不 
多 ， 只 不 过 需要 使 用 const 关 键 字 。 

代码 清单 3-39 展 示 了 一 个 标准 的 对 象 安 全 的 trait。 

代码 清单 3-39: 标准 的 对 象 安全 的 trait 

1 Cran: Bat f 

2 tn bax(selr, x: usZ); 
‘3 fn bay(&self); 
4 fn baz(&mut self); 
3 } 


代码 请 单 3-39 满 足 对 象 安全 trait 的 规则 ， 所 以 它 是 对 象 安全 的 。trait 
Bar 不 受 Sized 限 定 ，trait 方 法 都 是 没有 额外 Self 类 型 参数 的 非 汉 型 成 员 方 
法 。 代 码 清单 3-40 展 示 了 典型 的 对 象 不 安全 的 trait。 

代码 清单 3-40: 上 典型 的 对 象 不 安全 的 trait 


1 YY SRARKSH trait 

os urat Foo 7 

3 th bade T> (Asali; 2: D2 

4. fn new() -> Self; 

zA } 

6. // 对 券 安 全 的 trait， 将 不 安全 的 方法 折 分 出 去 
Ss Etat Foo { 

8. fn bad<T>(&self, x: T); 

9, } 

J Grait Foamy Bar i 

1 fn new() -> Self; 

Las i 

13. // MRR trait, M where Fa 

4. trait Boo { 

Ta. tt pOT (esel; Bs Ty? 

1 6. fn new() -> Self where Self: Sized; 
Ly. 9 


在 代码 清单 3-40 中 ， 人 代码 第 2 行 到 第 5 行 定义 的 trait Foot AAG ke 
对 象 安全 trait 方 法 的 规则 ， 上 所 以 它 不 能 被 作为 trait 对 象 使 用 。 但 是 如 果 
想 继续 把 该 trait 作 为 对 象 使 用 ， 可 以 将 此 trait 分 离 为 两 个 trait， 如 代码 第 
7 行 到 第 12 行 所 示 ， 将 对 象 不 安全 的 方法 摘 到 为 一 个 Bar trait 中 。 但 是 这 
种 方法 比较 烦琐 。 了 最 好 的 办 法 是 使 用 where 子 句 ， 如 代码 第 14 行 到 第 16 
行 所 示 ， 在 new 方 法 签名 后 面 使 用 where 子 句 ， 增 加 Self: Sized 限 定 ， 则 
trait Foo 又 成 为 了 一 个 对 象 安全 的 trait。 只 不 过 在 trait Foo 作 为 trait 对 象 且 
A? Sized 限定 时 ， 不 允许 调用 该 new 方 法 。impl Trait 

在 Rust 2018 有 版 本 中 ， 引 入 了 可 以 静态 分 友 的 抽象 类 型 impl Trait 
o 如果 说 trait 对 象 是 装 箱 抽象 类 型 (Boxed Abstract Type) Hid, Ff 
么 impl Trait 就 是 拆 箱 抽象 类 型 (Unboxed Abstract Type) . “2k 
箱 ” 和 和 “ 拆 箱 ”是 业界 的 抽象 俗语 ， 其 中 “ 北 箱 ”代表 将 值 托 官 到 堆 内 存 ， 
而 “ 拆 箱 ? 则 是 在 栈 内 存 中 生成 新 的 值 ， 更 详细 的 内 容 会 在 第 4 章 中 指 
述 。 总 之 ， 少 箱 抽象 类 型 代表 动态 分 及 ， 拆 箱 抽 象 关 型 代表 毅 态 分 肥 。 

目前 impl Trait 只 可 以 在 输入 的 参数 和 返回 值 这 两 个 位 置 使 用 ， 在 
不 远 的 将 来 ， 还 会 拓展 到 其 他 位 置 ， 比 如 ]et 定 义 、 关 联 类 型 等 。 


接 下 来 使 用 impl Trait 语 法 重 构 第 2 章 的 代码 清单 2-53， 如 代码 清单 3- 
ALATA o 
代码 清单 3-41: 使 用 impl Trait 语 法 重 构 第 2 章 的 代码 清单 2-53 


use std::fmt::Debug; 


pub trait Fly { 
fn tlyléeselt) => Bool; 
} 
# [derive (Debug) ] 
struct: Duck; 
# [derive (Debug) ] 
Struct. Pid: 
impl Fly for Duck { 
fn fly(&self) -> bool { 


return true; 


} 
impt Fly for Pig { 
in tly(éselt) == bool 4 


return false; 


} 
fn tly Statics: Imel Ply+Vepug) => bool 1 
S. LLC} 
} 
En can tlylss impl FlytDebug) 一 > impl Fly { 
LF S:LLA] 
pmnrlA es Se; ce LLY"; B)? 
}else{ 
printilnd ("{ 7} can’t fly"; SB) 


} 

let pig = Pig; 

assert eq! (fly statie (pig); falsely 
let duck = Duck; 

assert. eq! (fly statie (dick), trie); 
let pig = Pig; 


let pig = can _ Fly (pig): // Pig 不 能 执行 “ 飞 ” 
let duck = Duck; 
let duck = can_fly(duck); = // Duck 能 执行 “ 飞 ” 


这 个 动作 


这 个 动作 


代码 清单 3-41 第 19 行 到 第 21 行 使 用 impl Fly+Debug 蔡 换 了 之 前 的 泛 
型 写法 ， 整 个 代码 看 上 去 清 碍 不 少 。 将 impl Trait 语 法 用 于 参数 位 置 的 时 
候 ， 等 价 于 使 用 trait 限 定 的 谤 型 。 

代码 第 22 行 到 第 29 行 定义 了 can_fly 函 数 ， 参 数 使 用 impl Fly+Debug 
抽象 类 型 ， 而 返回 值 指 定 了 impl Fly 抽 象 类 型 。 将 impl Trait ýk H FR 
回 值 位置 的 时 候 ， 实 际 上 等 价 于 给 返回 奖 型 增加 一 种 trait 限 定 范 围 。 

在 main 函 数 中 调用 fly_static 函 数 的 时 候 ， 也 不 再 需要 使 用 turbofish 
HEITRI ERN., HA, WREE Rust 无 法 目 动 推导 类 型 的 情况 下 ， 
还 需要 显 式 指 定 类 型 ， 只 不 过 无 法 使 用 turbofish 操 作 和 从 。 调 用 can_fly 孙 
数 可 以 返回 impl Fly 类型， 但 它 属 于 静态 分 发， 在 调用 的 时 候 根据 上 下 
文 硝 定 返 回 的 具体 闫 型 。 

但 是 目前 ， 还 不 能 在 let 语句 中 为 变量 指定 impl Fly 类 型 。 比 如 let 
duck: impl Fly=can_fly (duck) 这 样 的 写法 是 不 允许 的 ， 但 是 在 不 远 的 
将 来 是 可 以 使 用 的 。 相 比 于 使 用 trait 对 象 ， 使 用 impl Trait 会 拥有 更 高 的 
性 能 。 

男 外 ，impl Trait 只 能 用 于 为 单个 参数 指定 抽象 类 型 ， 如 果 对 多 个 参 
数 使 用 impl Trait 语 法 ， 编 译 帮 将 报错 ， 如 代码 清早 3-42 所 示 。 

代码 清单 3-42: 多 个 参数 类 型 使 用 impl Trait 语 法 的 情况 


use std ops Adad; 
2 fn sum<T>(a: impl Add<Output=T>, b: impl Add<Output=T>) -> T{ 
EP a +b 
ae J 

代码 清单 3-42 中 的 sum Zee SPSS: a Alb, URE 
指定 了 impl Add<Output=T 之 抽象 闫 型 ， 编 详 将 会 报错 。a 和 b 会 被 编 
详 苍 认为 是 两 个 不 同 的 类 型 ， 不 能 进行 加 法 操作 。 这 一 点 在 使 用 时 要 注 


IK o 


在 Rust 2018 版 本 中 ， 为 了 在 语义 上 和 impl Trait 语 法 相对 应 ， 专 门 为 
动态 分 发 的 trait 对 象 。” 增加 了 狐 的 语法 dyn Trait  ， 其 中 dyn 是 
Dynamic (AIA) W4iS. BU, impl Trait KRESNA, dyn Trait 代 表 
动态 分 友 。 


我 们 可 以 在 代码 清单 3-42 的 基础 上 新 增 使 用 dyn ”Trait 语 法 的 函数 ， 
如 代码 清单 3-43 所 示 。 
代码 清单 3-43: 在 代码 清单 3-42 的 基础 上 新 增 使 用 dyn Trait 语 法 的 
BY 


fn dyn can fly(s: impl FlytDebugt'static) => Box<dyn Fly> | 
it SELYA 
DL Gan ELLY", S)? 
j}else{ 
Princlmtc Lies Can't LI"; Sjj 
Box: :new(s) 


代码 清单 3-43 在 代码 清单 3-42 的 基础 上 新 增 了 男 数 dyn_can_fly， 使 
用 了 新 的 dyn Trait 语 法 。 形 如 Box<dyn Fly 二 实际 上 就 是 返回 的 trait 对 
R, Æ Rust 2015 版 本 中 也 可 以 写作 Box<Fly> 。 方 法 签名 中 出 现 的 / 
static 是 一 种 生命 周期 参数 ， 它 限定 了 impl Fly+Debug 抽 象 类 型 不 可 能 是 
引用 类 型 ， 因 为 这 里 出 现 引 用 类 型 可 能 会 引 友 内 存 不 安全 。 我 们 会 在 第 
5 草 更 详细 地 介绍 关于 生命 周期 参数 的 内 容 。 


om~amnmwmewnmbh X 


3.4.4 tr Strait 


trait 这 种 对 行为 约束 的 特性 也 非常 适合 作为 类 型 的 标 伴 ” 。 这 束 好 
比 市 场 上 流通 的 产品 ， 痢 被 三 家产 上 了 “生产 日 期 * 和 “有 效 期 * 这 样 的 标 
伦 ， 消 费 者 通过 这 种 标签 瓯 可 以 识别 出 未 过 期 的 产品 。Rust 殊 是 “三 
RR”, RAT an”, Petra) Azar? m” me EN AA se, 
起 到 标识 的 作用 。 当 开发 者 消费 这 些 类 型 “产品 ”时 ， 编 译 右 会 进行 “ 严 
格 执 法 ”， 以 你 证 这 些 类 型 “产品 ”是 “合格 的 ”。 

Rust 一 共 提 供 了 5 个 重要 的 标签 trait， 都 被 定义 在 标准 库 std: : 
marker 模 块 中 。 它 们 分 别 是 : 

- Sized trait， 用 来 标识 编译 期 可 确定 大 小 的 类 型 。 

Unsize trait， 目 前 该 trait 为 实验 特性 ， 用 于 标识 动态 大 小 类 型 
(DST) 。 


‘Copy trait， 用 来 标识 可 以 按 位 复制 其 值 的 类 型 。 

` Send trait， 用 来 标识 可 以 跨 线 程 安全 通信 有 的 类 型 。 

- Sync trait， 用 来 标识 可 以 在 线程 间 安 全 共享 引用 的 闫 型。 

除 此 之 外 ，Rust 标 准 库 还 在 增加 新 的 标签 trait 以 满足 变化 的 需求 。 

Sized trait 

Sized trait 非常 重要 ， 编 详 需 用 它 来 识别 可 以 在 编译 期 确定 大 小 的 
类 型 。 代 码 清单 3-44 展 示 了 Sized trait 的 内 部 实现 。 

代码 清单 3-44: Sized trait 内 部 实现 


Ta #[lang = "sized"] 

Z ‘pub trait Suzed { 

Si, // 代 码 为 空 ， 无 具体 实现 方法 
A } 


Sized trait ~^ T trait ,» ALAM MVE At Strait eon EASE. IX 
里 真正 起 “ 打 标 签 ”作用 的 是 代码 清 日 3-44 第 1 行 的 属性 # [lang= " sized 
"] ， 访 属性 lang 表 示 Sized trait 供 Rust 语 言 本 里 使 用 ， 声 明 为 " sized 
" ， 称 为 语言 项 (Lang Item) , 1tF9q Eas OAL Sized trait 如 何 定义 
了 。 还 有 一 个 相似 的 例子 是 加 号 操作 ， 当 两 个 整数 相 加 的 时 候 ， 比 如 
at+b， 编 译 器 束 会 去 找 Add: : add (a, b) ， 这 也 是 因为 加 号 操作 是 语 
言 项 #[lang= "add" ] 。 

Rust 语 言 中 大 部 分 类 型 都 是 默认 Sized 的 ， 所 以 在 写 泛 型 结构 体 的 时 
候 ， 没 有 显 式 地 加 上 Sized trait 限 定 ， 如 代码 清单 3-45 所 示 。 

代码 清单 3-45: yz WER Sized trait 限 定 


i| AN SEEGE FOGOS TT]? 
ig struct Bar<T: YSized> tT} 


ARI 3-45 Foose “Siz aA, ST FFoo<T: Sized 
>>， 如 条 需要 在 结构 体 中 使 用 动态 大 小 类 型 ， 则 需要 改 为 <T: ? Sized 
二 限定 。 

? Sized 是 Sized trait 的 男 一 种 语法 。Sized、Unsize 和 ? Sized 的 关系 
如 图 3-8 所 示 。 


T: ?Sized 


T: Sized 


waa / 可 确定 大 小 





图 3-8: Sized、Unsize 和 ? Sized 的 关系 

Sized 标 识 的 是 在 编译 期 可 确定 大 小 的 类 型 ， 而 Unsize 标 识 的 是 动态 
大 小 类 型 ， 在 编译 期 无 法 确定 其 大 小 。 目 前 Rust 中 的 动态 类 型 有 trait 和 和 
[了 站 ， 其 中 [四 代表 一 定数 量 的 T 在 内 存 中 依次 排列 ， 但 不 知道 具体 的 数 
量 ， 所 以 它 的 大 小 是 未 知 的 ， 用 Unsize 来 标记 。 比 如 str 字 符 串 和 定 长 数 
组 IT; N]; [T] KENT; NIH, SNARARE ELT]. 

而 ? Sized 标 识 的 类 型 包含 了 Sized 和 Unsize 所 标识 的 两 种 类 型 。 所 
以 代码 清单 3-45 中 泛 型 结构 体 Bar<T: ? Sized> 支 持 编译 期 可 确定 大 小 
类 型 和 动态 大 小 类 型 两 种 类 型 。 

但 是 动态 大 小 类 型 不 能 随意 使 用 ， 还 需要 这 循 如 下 三 条 限制 规则 : 

- 只 可 以 通过 胖 指 针 来 操作 Unsize 类 型 ， 比 如 &[T] 或 &Trait。 

变量 、 参 数 和 枚 举 变 量 不 能 使 用 动态 大 小 类 型 。 

结构 体 中 只 有 最 后 一 个 字段 可 以 使 用 动态 大 小 类 型 ， 其 他 字段 不 

可 以 使 用 。 


所 以 ， 当 使 用 ? Size 限 定时 ， 应 该 想 想 这 三 条 规则 。 
Copy trait 


Copy trait 用 来 标记 可 以 按 位 复制 其 值 的 类 型 ， 按 位 复制 等 价 于 C 语 
言 中 的 memcpy 4! 。 代 码 清单 3-46 展 示 了 Copy trait 的 内 部 实现 。 


代码 清单 3-46: Copy trait 内 部 实现 
Ls #{[lang = "copy"] 
Z. pub trait Copy : Clone | 
3. // 代 码 为 室 ， 无 具体 实现 方法 
4. } 
注意 代码 清单 3-46 第 1 行 的 lang 必 性， 此 时 声明 为 "copy " 。 此 Copy 
trait 继 承 自 Clone ”trait， 意 味 看 ， 要 实现 Copy ”trait 的 类 型 ， 必 须 实 现 
Clone trait 中 定义 的 方法 。 代 码 清单 3-47 展 示 了 定义 于 std: : clone 模 块 
中 的 Clone trait 内 部 实现 。 
代码 清单 3-47: Clone trait 内 部 实现 
i. pub trait Clone : Sized i 


Za fn clone(&self) -> Self; 
Dis fn clone from(é&mut self, source: Self} | 
4. *self = source.clone() 
Ss } 
6. } 


AEX, Clone trait 继 承 自 Sized， 意 味 着 要 实现 Clone trait 的 对 象 
必须 是 Sized 类 型 。 代 码 清单 3-47 第 3 行 的 clone_from 方 法 有 默认 的 实现 ， 
并 且 其 默认 实现 是 调用 Clone 方法， 所 以 对 于 要 实现 Clone trait 的 对 象 ， 
只 需要 实现 clone 方 法 就 可 以 了 。 

如 果 想 让 一 个 类 型 实现 Copy trait， 就 必须 同时 实现 Clone trait， 如 
代码 清 蛙 3-48 所 示 。 

代码 清单 3-48: 想 实 现 Copy trait 就 必须 同时 实现 Clone trait 

Ls Strut Mystrucc; 


a impl Copy for MyStruct { 9 

3 impl Clone for MyStruct { 

4. fn clone(&self) -> MyStruct | 
‘a *self 

6 } 


7. 4 
如 果 每 次 虱 这 样 实 现 一 壳 ， 会 比较 及 烦 。 所 以 Rust 提 供 了 更 方便 的 


derive 属 性 贷 我 们 完成 这 项 重复 的 工作 ， 如 代码 清单 3-49 所 示 。 
代码 清单 3-49: 使 用 deritie 属 性 实现 Copy trait 和 Clone trait 
1. #[derive (Copy, Clone) ] 
4. tet Mystruct? 

这 样 代 人 码 就 简练 多 了 。 

Rust 为 很 多 基本 数据 类 型 实现 了 Copy trait， 比 如 第 用 的 数字 次 型 、 
FIF (Char) 、 布 尔 类 型 、 单 元 值 、 不 可 变 引 用 等 。 代 码 清单 3-50 提 供 
了 一 个 检测 函数 ， 可 以 检测 哪些 类 型 实现 了 Copy trait. Shp Ewe A H 
了 一 个 加 上 Copy trait 限 定 的 泛 型 函数 test_copy， 如 果实 现 了 Copy traith 
类 型 ， 则 可 以 正常 编 详 ;， 如 末 没 有 实现 ， 则 会 报错 。 

代码 清单 3-50: 检测 类 型 是 否 实现 了 Copy trait 

ke in best copysT: Copys(4a: TJ | 
printcin! ("hhh") 
} 
fn main() { 
let a = "Strang™.to stringi); 
test copy (a); 


Jon OF e W N 


} 


代码 清单 3-50 测 试 的 类 型 是 String， 即 字符 串 ， 编 译 会 报 以 下 错 
WR: 
error [E0277]: the trait bound ‘std::string::String: Std: :marker::CopY 
is not satisfied 
| test copy (a) ; 
| CANAKAAKKSS the trait ‘std::marker::Copy is not implemented for 
"BUG! TSLTING i String 
看 得 出 来 ，String 类 型 并 没有 实现 Copy trait. 
那么 这 个 空 的 Copy trait 到 底 有 什么 作用 了 呢 ? 不 要 忘记 ，Copy 是 一 1 
标签 trait， 编 详 硕 做 闫 型 检查 时 会 检测 闫 型 所 市 的 标签 ， 以 验证 它 古 
仍 “ 合 格 ”。Copy 的 行为 是 一 个 隐 却 的 行为 ， 开 发 者 不 能 重 载 Copy 行 
为 ， 它 永远 都 是 一 个 简单 的 位 复制 o Copy NITIR EERTE EH 
定 、 函 数 参数 传递 、 函 数 返回 等 场景 中 ， 因 为 这 些 场景 是 开发 者 无 法 控 


HA, PTO ae eam PEAS OR TRUE. FES SCRE ZR, FM Copy 
义 有 更 深 的 了 解 。 

Clone trait 是 一 个 显 式 的 行为 ， 任 何 类 型 都 可 以 实现 Clone trait, Ff 
发 者 可 以 目 由 地 按 需 实现 Copy 行 为 。 比 如 ，String 类 型 并 没有 实现 Copy 
trait， 但 是 它 实 现 了 Clone ”trait， 如 末代 人 码 里 有 需要 ， 只 需要 调用 String 
类 型 的 clone 方法 即 可 。 但 需要 记 住 一 点 ， 如 果 一 个 类 型 是 Copy 的 ， 它 
的 clone 方 法 仅仅 需要 返回 *self 即 可 〈 人 参考 代码 清单 3-48) 。 

并 非 所 有 类 型 都 可 以 实现 Copy trait 。 对 于 目 定 义 类 型 来 说 ， 必 须 
让 所 有 的 成 员 都 实现 了 Copy trait， 这 个 类 型 才 有 资格 实现 Copy trait. WW 
果 是 数组 类 型 ， 旦 其 内 部 元 系 都 是 Copy 类 型 ， 则 数组 本 号 就 是 Copy 类 
型 ， 如 果 是 元 组 类 型 ， 日 其 内 部 元 系 都 是 Copy 类 型 ， 则 该 元 组 会 目 动 实 
现 Copy; 如 果 是 结构 体 或 枚 举 类 型 ， 只 有 当 每 个 内 部 成 员 都 实现 Copy 
时 ， 它 才 可 以 实现 Copy， 并 不 会 像 元 组 那样 目 动 实现 Copy。 疼 3-9 形 象 
地 总 结 了 Copy 和 Clone 的 区 别 。 


return “self 





图 3-9: Copy 和 Clone 的 区 别 
Send trait 和 Sync trait 
Rust 作 为 现代 编程 语言 ， 目 然 也 提供 了 语言 级 的 并 发 文 持 ”。 只 不 
过 Rust 对 并 发 的 文 持 和 其 他 语言 有 所 不 同 。Rust 在 标准 库 中 提供 了 很 多 
并 发 相关 的 基础 设施 ， 比 如 线程 、Channel、 锁 和 Arc 等 ， 这 些 都 是 独立 
于 语言 核心 之 外 的 库 ， 意 味 着 基于 Rust 的 并 发 方案 不 受 标准 库 和 语言 的 
限制 ， 开 发 人 员 可 以 编写 目 己 所 需 的 并 发 模型 。 


一 二 以 来 ， 多 线程 并 及 编 程 都 存在 很 大 问题 ， 因 为 它 会 增加 复杂 
性 ， 想 要 编写 正确 非常 困难 ， 调 试 也 非常 困难 ， 难 以 将 问题 复 现 。 线 程 
不 安全 的 代码 会 因为 共享 内 存 而 产生 内 存 人 破坏 (Memory Corruption) 行 

多 线程 编程 之 所 以 有 这 么 严重 的 问题 ， 是 因为 系统 级 的 线程 是 不 可 
控 的 ， 编 写 好 的 代码 不 一 定 会 按期 望 的 顺 友 执行， 会 种 来 范 态 条 件 
(Race Condition) 。 不 同 的 线程 同时 访问 一 块 共 享 变 量 也 会 造成 数据 
苑 争 (Data Race) 。 苋 态 条 件 是 不 可 能 被 消除 的 ， 数 据 苋 争 是 有 可 能 
锌 消除 的 ， 而 数据 苋 争 是 线程 安全 最 大 的 “隐患 ” 。 很 多 其 他 语言 通过 
各 种 成 熟 的 并 发 解决 方 采 来 文 持 并 发 编程 ， 比 如 Erlang 提 供 轻 量 级 进程 
和 Actor 并 发 模型 ，Golang 提 供 了 协 程 和 CSP 并 发 模型 。 而 Rust 则 从 正面 
解决 了 这 个 问题 ， 它 的 “秘密 武 占 ”是 类 型 系统 和 所 有 权 机 制 |。 

Rust 所 供 了 Send 和 Sync 两 个 标签 trait， 它 们 是 Rust 无 数据 苋 争 并 发 
的 基石 。 

”实现 了 Send 的 类 型 ， 可 以 安全 地 在 线程 间 传 递 什 ， 也 惑 是 说 可 以 
跨 线 程 传递 所 有 权 。 

实现 了 Sync 的 类 型 ， 可 以 跨 线 程 安全 地 传递 共 诗 不 可 释 ) 引 
Ho 

有 了 这 两 个 标签 trait， 束 可 以 把 Rust 中 所 有 的 类 型 归 为 两 类 : 可 以 
安全 足 线 程 传 递 的 什 和 引用 ， 以 及 不 可 以 踪 线 程 传递 的 仁和 引用 o H 
配合 所 有 权 机 制 ， 带 来 的 效果 就 是 ，Rust 能 够 在 编 详 期 就 检查 出 数据 
oe St Ma» ， 而 不 需要 等 到 运行 时 再 排查 。 

代码 清单 3-51 壬 试 在 多 线程 之 间 共 至 不 可 变 变 量 。 

代码 清单 3-51: 多 线程 之 间 共 至 不 可 变 变 量 


1 use std::thread; 

2 fn main() { 

Si ilet x = veci([ly 2, 3, 4l} 
4 thread: :spawn(|| xX); 

F } 


代码 清单 3-51 使 用 标准 库 thread 柑 块 中 的 Spawn 函 数 来 创建 子 线程 ， 
需要 一 个 团 包 作为 参数 ， 可 以 编译 通过 。 人 变量 x 被 团 包 捕获 ， 传 递 到 子 


线程 中 ， 但 是 x 默 认 不 可 变 ， 所 以 多 线程 之 间 共 享 是 安全 的 。 再 看 看 如 
果 传 入 的 是 可 变 变 量 会 怎么 样 ? 如 代码 清单 3-52 所 示 。 
代码 清单 3-52: 多 线程 之 间 共 享 可 变 变 量 


Ea use stds <thread: 


2 fn main() 4 

3 let mut x = vec! [1, 2, 3, 4]; 
4. thread: :spawn (|| { 

5 > 

6 } ); 

7 二 BuUSsh (2) 2 


8 . } 

我 们 在 代码 清单 3-52 中 声明 了 可 变 变 量 x， 然 后 在 子 线程 中 通过 
push 方 法 在 x 中 插入 元 素 5， 在 父 线程 中 又 通过 push 方 法 插入 元 素 2。 

可 以 分 析 一 下 这 个 过 程 ， 假 如 编译 正常 通过 的 话 ， 那 么 在 父子 线程 
中 怠 都 可 以 访问 这 个 共享 的 可 变 变 量 ， 这 就 有 可 能 出 现 数据 竞争 的 问 
蚌 。 比 如 在 父 线程 中 其 他 地 方 判 新 数 组 长 度 等 于 5 的 时 候 ， 取 出 数组 最 
后 一 个 值 ， 那 么 这 个 值 可 能 是 2， 也 可 能 是 5， 这 就 造成 了 线程 不 安全 
的 问题 。 

但 实际 上 ， 代 码 清单 3-51 是 无 法 编译 通过 的 ， 会 报 如 下 错误 : 


error[E0373]: closure may outlive the current function, but it borrows 
‘x’, which is owned by the current function 

| 

| thread::spawn( || { 

| ^^ may outlive borrowed value x 

| x [L]? 

| - x 1s borrowed here 
help: to force the closure to take ownership of x (and any other referenced 
variables), use the ‘move’ keyword, as shown: 


| thread::spawn( move || { 


因为 闭 包 中 的 x 实际 为 借用 ，Rust 无 法 确定 本 地 变量 x 可 以 比 团 包 中 
的 x 存 活 得 更 入， 假如 本 地 变量 x 被 释放 了 ， 闭 包 中 的 x 信 用 惑 成 了 悬垂 
指 夺 ， 霹 成 内 存 个 安全 。 所 以 这 里 的 编 详 从 建议 在 闭 包 前 面 使 用 move 


关键 字 来 转移 所 有 权 ， 转 移 了 所 有 权 意 味 着 x 变量 只 可 以 在 子 线程 中 访 
间 ， 而 父 线程 再 也 无 法 操作 变量 x， 这 就 阻止 了 数据 竞争 。 代 码 清单 3- 
53 通 过 在 多 线程 之 间 move 可 变 变 量 修 正 了 数据 范 争 的 问题 。 

代码 清单 3-53: 在 多 线程 之 间 moiie 可 变 变 量 


1 use std::thread; 

2 fn main() { 

he let mut x = vec! [1, 2, 3, 4]; 

4 thread: :spawn (move || x.push(1)); 
5 Fr Sepusth (2)? 

6 } 


代码 清单 3-53 中 编译 占 的 检查 利用 了 所 有 权 机 制 ， 我 们 会 在 第 5 章 
学 习 关 于 所 有 权 的 更 多 细 市 。 但 这 里 之 所 以 可 以 正常 地 move 和 变量 ， 也 
是 因为 数组 x 中 的 元 系 均 为 原生 数据 类 型 ， 上 默认 都 实现 了 Send 和 Sync 标 
答 trait， 所 以 它们 器 线程 传递 和 访问 都 很 安全 。 在 x 侯 转 移 到 子 线程 之 
后 ， 束 个 允许 父 线程 对 x 进行 修改 ， 如 代码 清单 3-53 的 第 5 行 所 示 ， 如 果 
KYA AT SARTRE, = a PES RCA o 

代码 清单 3-54 展 示 了 没有 实现 Send 和 Sync 的 类 型 在 多 线程 中 传递 的 
情况 。 

代码 清单 3-54: 在 多 线程 之 间 传 递 没 有 实现 Send 和 Sync 的 关 型 

i use std::thread; 


EA use Star: re: RG 

cM fn main() { 

4. let x = Rc: :new(vec! [1, 2, 3, 4]); 
oe thread::spawn( move || { 

6. ee a 

Bs } ) 7 

8. } 


代码 清单 3-54 中 使 用 了 std: : re: : RecA aK HWA, RAX 
现 Send 和 Sync， 所 以 不 能 在 线程 之 间 传 递 变 量 x。 编 详 报错 如 下 : 


error E0277} the trait bound “Std: *rct:Re<std: yeti *vec<132>>: 
std::marker::Send’ is not satisfied in ~[closure@src/main.rs: 
Ki} std: res: Re<std; vec: sVee<x132>> | - 

| thread::spawn( move || { 

| PS DEE NANNY "SCS RO i EROSTA (Vert Wa Bnet be Sait 


between threads safely 


编 详 错误 信息 显示 : AR EEX {Hh zestd: : rc: : Re<std: : 
vec: : Vec<i32 之 >， 不 能 在 线程 之 间 传 递 。 因 为 Rc 是 用 于 引用 计数 
的 智能 指针 ， 如 果 把 Rc 类 型 的 变量 x 传递 到 男 一 个 线程 中 ， 会 导致 不 同 
线程 的 Rc 变量 引用 同一 块 数据 ，Rc 内 部 实现 并 没有 做 任何 线程 同步 的 
处 理 ， 因 此 这 样 做 必然 不 是 线程 安全 的 。 可 见 ，Rust 义 帮助 开发 者 避免 
了 一 场 “并 发 浩 动 ”。 
Send 和 Sync 标 签 trait 和 前 和 面 所 说 的 Copy、Sized 一 样 ， 内 部 也 没有 其 
体 的 方法 实现 。 它 们 仅仅 是 标记 ， 可 以 安全 地 路线 程 传递 和 访问 的 类 型 
用 Send 和 Sync 标记 ， 人 否则 用 ! Send 和 ! Sync 标记 。 代 码 清 单 3-55 展 示 
了 其 内 部 实现 。 
代码 清单 3-55: Send 和 Sync 的 内 部 实现 
Tg #[lang = "send"] 
-P pub unsafe trait Send { 


3 // 代 码 为 空 ， 无 具体 实现 方法 
4. } 

GA = 

6 #[lang = "sync"] 

7 pub unsafe trait Sync { 

8 / /代码 为 空 ， 无 具体 实现 方法 
9. } 


代码 清单 3-56 展 示 了 Rust 为 所 有 关 型 实现 Send 和 Sync 的 过 程 。 
代码 清单 3-56: Rust 为 所 有 类 型 实现 Send 和 Sync 
unsafe impl Send for .. { | 


a impl<Ts ?Sizgea> geno for *const T 4 } 
3. impl<T: ?Sized> !Send for *mut T 4 | 


代码 清单 3-56 的 第 1 行使 用 了 特殊 的 语法 for..， 表 示 为 所 有 类 型 实现 
Send，Sync 也 同 理 。 同 时 ， 第 2 行 和 第 3 行 也 对 两 个 原生 指针 实现 了 ! 
Send， 代 表 它 们 不 是 线程 安全 的 类 型 ， 将 它们 排除 出 去 。 代 人 码 3-56 1K 
仪 展 示 了 部 分 代码 ， 完 整 的 代码 可 以 参考 Rust VAS) 
src/libcore/marker.rs 源 文件 。 

对 于 目 定 义 的 数据 类 型 ， 如 果 其 成 员 类 型 必须 全 部 实现 Send 和 和 
Sync， 此 类 型 才 会 修 日 动 实 现 Send 和 Sync。Rust 也 提供 了 类 似 Copy 和 
Clone 那 样 的 derive 属 性 来 日 动 导 入 Send 和 Sync 的 实现 ， 但 并 不 建议 开 
发 者 使 用 该 属性 ， 因 为 它 可 能 引起 编译 占 检 查 不 到 有 的 线程 安全 问题 。 

Ki, Rust 凭借 Send. Sync 和 所 有 权 机 制 ， 在 编译 期 束 可 以 
检测 出 线程 安全 的 问题 ， 保 证 了 无 数据 苋 争 的 并 发 安全 ， 让 开发 者 可 
以 “无 恕 慢 ”地 编写 多 线程 并 发 代码 ， 并 且 可 以 让 开发 者 目 由 使 用 各 种 并 
RIRH 


3.5 类 型 转换 


在 编程 语言 中 ， 类 型 转换 分 为 隐 云 类 型 转换 (Implicit Type 
Conversion ) 和 显 式 类 型 转换 (Explicit Type Conversion ) . KAA% 
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强制 类 型 转换 (Type Coercion ) 。 显 式 类 型 转换 是 由 开发 者 指定 的 ， 
束 是 一 般 意 义 上 有 的 类 型 转换 (Type Cast ) 。 

不 当 的 类 型 转换 会 市 来 内 存 安 全 问题 。 比 如 C 语 言 和 JavaScript 语 言 
中 的 隐 式 类 型 转换 ， 如 果 不 多 加 注意 ， 可 能 会 得 到 意料 之 外 的 结果 。 再 
比如 C 语 言 个 同 大 小 类 型 相互 转换 ， 长 类 型 转换 为 短 类 型 会 造成 洲 出 等 
问题 。 反 观 Rust 语 言 ， 只 要 不 乱用 unsafe 块 来 跳 过 编译 器 检查 ， 就 不 会 
因为 类 型 转换 出 现 安全 问题 。 


3.5.1 Deref 解 引用 


Rust 中 的 隐 式 类 型 转换 基本 上 只 有 目 动 解 引 用 。 目 动 解 引用 的 目的 
主要 是 方便 开发 者 使 用 智能 指针 。Rust 中 提供 的 Box<T>. Rc<T> 
和 String 等 类 型 ， 实 际 上 是 一 种 智能 指针 。 它 们 的 行为 束 像 指针 一 
样 ， 可 以 通过 “ 解 引 用 ?操作 符 进 行 解 引 用 ， 来 获取 其 内 部 的 值 进行 操 
作 。 第 4 章 会 介绍 关于 智能 指针 的 更 多 细 市 。 

A oe S| FA 

目 动 解 引用 虽然 是 编译 右 来 做 的 ， 但 是 目 动 解 引 用 的 行为 可 以 由 
Ft ACA RIE MX 
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实现 Deref trait 来 和 目 定 义 解 引用 操作 。Deref 有 一 个 特性 是 强制 隐 式 转 
的 ， 规 则 是 这 样 的 : 如 果 一 个 类 型 TT 实现 Sf Deref<Target=U>, Mji% 
类 型 TT 的 引用 (或 贸 能 指针 ) 在 应 用 的 时 候 会 被 目 动 转换 为 类型 U。 

代码 清单 3-57 展 示 了 Deref trait 内 部 实现 。 

代码 清单 3-57:，， Deref trait 内 部 实现 





pub trait Deref { 
type Target: ?Sized; 
fn deref(&self) -> &Self::Target; 
} 
pub trait DerefMut: Deref { 
in deref mat(tmut self) => gmut Seli:: Target; 
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} 

DerefMut 和 Deref 类 似 ， 只 不 过 它 是 返回 可 变 引 用 的 。Deref 中 包 
含 基 联 关 型 Target， 它 表示 解 引 用 之 后 的 目标 类 型 。 

String 关 型 实现 了 Deref。 比 如 在 代码 请 单 3-58 中 连接 了 两 个 String 


FIR. 
代码 清单 3-58: 连接 两 个 String 字 符 串 
il. fn main() { 
2 let a = “hello”".to stringll3 
a let b = " world to string) 7 
4. let c = a + &b; 
5. printian! ("{<7}", Els Jy "Helle world" 
6. } 


变量 a 和 b 都 是 String 关 型 字符 串 ， 当 使 用 加 号 拘 作 符 将 它们 连接 起 
来 时 ， 我 们 使 用 了 &b， 它 应 该 是 一 个 &String 关 型 ， 而 String 类 型 实现 的 
add 方 法 的 右 值 参数 必须 是 &str 类 型 。 按 理 说 ， 代 码 清单 3-58 应 该 编译 出 
音 ， 但 现在 它 是 可 以 正章 运 行 的 。 原 因 就 是 String 关 型 实现 了 Deref<< 
Target=str 之 ， 代 人 码 清 单 3-59 展 示 了 其 内 部 实现 。 
代码 清单 3-59:， String Ml Deref<Target=str > 
impl ops::Deref for String { 

type Target = str; 

fn deref(&self) -> &str { 


unsafe { str::from_utf8 unchecked(&self.vec) } 
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} 
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第 运行 。 除 了 String 半 型， 标准 库 中 第 用 的 其 他 类型 都 实现 了 Deref， 比 
如 Vec<T > 之 《其 实现 Deref 的 代码 参见 代码 清单 3-60) ~ Box<T>,. Re 
<T>、Arc<T> 等 。 实 现 Deref 的 目的 只 有 一 个 ， 就 是 简化 编程 。 
代码 清单 3-60，Vec<<T > 实现 Deref 
ue tn foots: é&l13521) 1 


Z. Princlin!<*4s?P}", 2101)% 
EA } 
4 fn main() { 
5 let v = vec! [1,2,3]; 
6. foo (&v) 
d } 


在 代码 清单 3-60 中 ，foo 国 数 的 参数 为 &[T] 关 型 。 而 在 调用 
foo (&v) 的 时 候 ，&v 的 类 型 为 &Vec<T>， 这 里 也 发 生 了 自动 解 引 
H, AlNVec<T> 325i f Deref<Target=[T]>, ArU&Vec<T> S4 A 
动 转换 为 &[T] 类 型 ，foo 函 数 得 以 正确 调用 。 自 动 解 引用 避免 了 开发 者 
目 己 手工 转换 ， 人 简化 了 编程 。 

在 函数 调用 时 ， 目 动 解 引 用 也 提供 了 极 大 的 方便 。 如 代码 清单 3-61 
所 示 ，Rc 指针 实现 了 Deref， 使 函数 调用 变 得 非常 方便 。 

代码 清单 3-61: Rc 指针 实现 Deref 


1 use stas src: + Rc; 

2 fn main() { 

S. let x = Rc::new ("hello"); 

4 priment" iir"; Srohars (l; 
5 } 


在 代码 清单 3-61 中 ， 变 量 x 是 Rc 二 &str 二 类 型 ， 它 并 没有 实现 过 
chars ©) 方法 。 但 是 现在 可 以 直接 调用 ， 因 为 Rc 二 T 二 实现 S Deref< 
Target <T> >. WEA SAAS ANE, TEAR sce, Wee 
像 Rc 并 不 存在 一 样 。 

手动 解 引 用 

但 在 有 些 情 况 下 ， 就 算 实现 了 Deref， 编 译 器 也 不 会 自动 解 引 用 。 


比如 ， 代 码 清单 ”3-61 是 因为 Rc 没有 实现 chars 方 法 ， 所 以 正常 解 引 用 ， 

但 是 当 某 类 型 和 其 解 引 用 目标 类 型 中 包含 了 相同 的 方法 时 ， 编 译 絮 就 不 

知道 该 用 哪 一 个 了 。 此 时 就 需要 手动 解 引 用 ， 如 代码 清单 3-62 所 示 。 
代码 清单 3-62: 手动 解 引用 的 情况 


iL use etd: tres rhe; 

Z fn main() { 

3. let x = Re::new("hello") ; 

4 let y = x.clone(); // Re<&str> 
S5 let z = (*x).clone(); {i Sate 
6 } 


在 代码 清单 3-62 中 ，clone 方 法 在 Rec 和 &str 关 型 中 都 被 实现 了 ， 上 所 以 
调用 时 会 直接 调用 Rc 的 clone 方 法 ， 如 果 想 调用 Rc 里 面 &str 类 型 的 done 
方法 ， 则 需要 使 用 “ 解 引 用 ”操作 人 符 手动 解 引 用 。 

男 外 ，match 引 用 时 也 需要 手动 解 引 用 ， 如 代码 清单 3-63 所 示 。 

代码 清单 3-63: match 引 用 时 需要 手动 解 引用 


L fn main() { 

fi les x = “hello” .toe sihrang (); 

Ji match &x { 

4. "hello" => {printin! ("hello") jy 
Sh => {} 

6. } 


7. } 

在 代码 清单 3-63 所 示 的 情况 中 ， 只 能 通过 手动 解 引用 把 &String 关 型 
转换 成 &str 类 型 ， 具 体 有 下 列 几 种 方式 。 

- match x.deref © ， 和 直接 调用 deref 方 法 ， 需 要 use std: : ops: : 
Deref. 

- match x.as_ref ©) ” ，String 类 型 提供 了 as_ref 方 法 来 返回 一 个 &str 
AW, WIV XT AsRef trait 中 。 

- match x.borrow () ， 方 法 borrow 定 义 于 Borrow trait 中 ， 行 为 和 
AsRef 类 型 一 样 。 和 需要 use std: : borrow: : Borrow 。 


- match&*x  ， 使 用 “ 解 引 用 ”操作 人 符 ， 将 String 转 换 为 strY， 然 后 再 
用 “引用 ?操作 符 转 为 &str。 
match&x[..] ， 这 是 因为 String 类 型 的 index 操 作 可 以 返回 &str 类 
AY 。 
忌 体 来 说 ， 除 了 目 动 解 引 用 隐 式 转换 ，Rust 还 提供 了 不 少 显 式 的 手 
动 转换 类 型 的 方式 。 平 时 编程 过 程 中 建议 多 翻阅 标准 库 文档 ， 能 够 发 现 
很 多 技巧 。 


3.5.2 as 操作 符 


as 操作 符 最 常用 的 场景 就 是 转换 Rust 中 的 基本 数据 类 型 。 需 要 注 
意 的 是 ，as 关键 字 不 支持 重 载 。 原 生 类 型 使 用 as 操作 符 进 行 转换 的 代码 
如 代码 清单 3-64 所 示 。 

代码 清单 3-64: 原生 类 型 使 用 as 操 作 符 进行 转换 


1 fn main() { 

2: let a = 1u32; 

3. let b = a as u64; 
4 let c = 3u64; 

5 let d = € as u32; 
6 } 


代码 清单 3-64 展 示 了 u32 和 u64 之 间 的 转换 ， 其 他 的 原生 类 型 也 都 可 
以 使 用 as 操作 符 进 行 转换 。 需 要 注意 的 是 ， 短 〈 大 小 ) 类 型 转换 为 长 
(大 小 ) 类 型 的 时 候 是 没有 问题 的 ， 但 是 如 果 反 过 来 ， 则 会 被 截断 处 理 
， 如 代码 清单 3-65 所 示 。 

代码 清单 3-65: u32 最 大 值 转 为 u16 类 型 时 被 截断 处 理 


i. fn main() { 
2 let a = std::u32::MAX; // 4294967295 
3 let b = a as ulo; 

4. assert Egi (hb; 659235)? 

5. let e = -1132; 

6 let f = e as u32; 

í; println! si" eaba (]))g 7/7 1 

8 princla!<«("{e97i", £)% Jy 4294967295 

9. } 

在 代码 清单 3-65 中 ， 变 量 a 被 赋 子 了 u32 关 型 的 最 大 值 ， 当 转换 为 
u16 类 型 的 时 候 ， 被 截断 处 理 ， 变 量 b 的 值 就 变 成 了 u16 类 型 的 最 大 值 。 
男 外 当 从 有 符号 类 型 回 无 从 号 类 型 转换 的 时 候 ， 最 好 使 用 标准 库 中 提供 
的 专门 的 方法 ， 而 不 要 直接 使 用 as 操 作 符 。 

无 监 义 完 全 限定 语法 

为 结构 体 实现 多 个 trait 时 ， 可 能 会 出 现 同名 的 方法 ， 代 人 码 清单 3-66 
就 展示 了 这 种 情况 。 此 时 使 用 as 操作 符 可 以 帮助 避免 蚊 义 。 

代码 清单 3-66: 为 结构 体 实现 多 个 trait 时 出 现 同名 方法 的 情况 


SERUES © (C32) 5 
Cea: A. 4 

fn test (self; 1: 132); 
} 
aT B 4 

tH test (sell, 1: 152); 
} 
Impl A tor Ss i 
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9, fn test(&self, 1: 132) { 

1 Q; Pee mb Ln ("irom A: (ser. Lli 
Ls } 

LZ. j 

LS. iol © tee S | 

1 4. Lr test Coselt, LY Lod) 4 

LS, erica! ("From Be Leth ty ali 
16. } 

La J 

LG. En thera.) 7 

19. let s = S(1); 

20. Ai itest tes, 1)ł 

2 D Bt Cestos; i1)}F 

PAA <o as Ass stestliés, LL); 

As “5 as Be: gtest (és, 1); 

24. } 


在 代码 清单 3-66 中 ， 结 构 体 S$ 实 现 了 A 和 B 两 个 trait， 虽 然 包 含 了 同 
名 的 方法 test， 但 是 其 行为 不 同 。 有 两 种 方式 调用 可 以 如 人 馅 歧义 。 
: 第 一 种 就 是 代码 清单 3-66 中 的 第 20 行 和 21 行 ， 直 接 当 作 trait 的 静态 
国 数 来 调用 ，A: : test © BKB: : test () 。 
第 二 种 就 是 使 用 as 操 作 符 ， 二 S as A>: : test O 或 <S as B 
>: : test () 。 
这 两 种 方式 叫 作 无 上 收 义 完全 限定 语法 (Fully Qualified Syntax for 
Disambiguation ) ， 曾 经 蕊 有 另外 一 个 名 字 : 通用 函数 调用 语法 
(UFCS ) 。 这 两 种 方式 的 共同 之 处 就 古都 需要 将 结构 体 实例 变量 s 的 


引用 显 式 地 传 入 test 方 法 中 。 但 是 建议 使 用 第 二 种 方式 ， 因 为 <S as A 
>: : tet O 语义 比较 完整 ， 它 表明 了 调用 的 是 S$ 结构 体 实现 的 A 中 的 
test 方 法 。 而 第 一 种 方式 遗漏 了 S 结 构 体 这 一 信息 ， 可 旋 性 相对 天 一 些 。 
这 两 种 方式 都 可 以 看 作对 trait 行 为 的 转换 。 

类 型 和 子 类 型 相互 转换 

as 转换 还 可 以 用 于 类 型 和 子 类 型 之 间 的 转换 。Rust 中 没有 标准 定 
义 中 的 子 类 型 ， 比 如 结构 体 继 承 之 类 ， 但 是 生命 周期 标记 可 看 作 子 类 
型 o ER’ static str 类 型 是 &&′ astr 类 型 的 子 类 型 ， 因 为 二 者 的 生命 
周期 标记 不 同 ，′ a Al’ static 都 是 生命 周期 标记 ， 其 中 a ee Ay 
记 ， 是 &str 的 通用 形式 ， 而 ′static 则 是 特 指 静态 生命 周期 的 &str 字 符 
串 。 所 以 ， 通 过 as 操 作 符 转换 可 以 将 &&′static ”str 类 型 转 为 & ”a str% 
型 ， 如 代码 清单 3-67 所 示 。 
代码 清单 3-67: 通过 as 操作 符 转 换 类 型 和 子 类 型 
fn main() { 

let ai 6 'Stetic str = “halle ™; // e*statie str 

let b: &str = a as &str; // &str 

let g: &' static str = b as &'static str: // & static str 


代码 清单 3-67 显 示 ， 可 以 通过 as 操 作 符 将 以 static str 和 长 a str 相 
互 转换 。 


3.5.3 From 和 JInto 
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From 和 Into 是 定义 于 std: : convert 模 块 中 的 两 个 trait。 它 们 定义 
J from 和 into 两 个 方法 ， 这 两 个 方法 互 为 肥 操作 。 代 码 清单 3-68 展 示 了 
这 两 个 trait 的 内 部 实现 。 

代码 清单 3-68: From 和 Into 的 内 部 实现 


1 pub Erart Fren<T> f 

2 fn from(T) -> Self; 
3 } 

4. pub trait Into<T> { 

5 fn into(self) -> T; 
6 } 


对 于 类 型 T， 如 果 它 实现 了 From<U>， 则 可 以 通过 T: 
from u) 来 生成 T 类 型 的 实例 ， 此 处 u 为 U 的 类 型 实例 。 代 码 清单 3-69 展 
示 了 String 类 型 的 from 方 法 。 

代码 清单 3-69: String 类 型 的 from 方 法 


1 fn main.) { 

2 let string = “hello™.to StreLng(l)? 

Be lec GLNSr string = String: siroem( "hel le”) > 
4 assert eq! (string, other string) ; 

3 } 


对 于 类 型 T， 如 果 它 实现 了 Into<U>， 则 可 以 通过 into 方 法 来 消耗 
目 身 转换 为 类 型 U 的 新 实例 。 人 代码 清单 3-70 展 示 了 如 何 使 用 String 交 型 的 
into D YOK fal AVA © 

代码 清单 3-70: 18 Hinto N YAK fa AIRA 


1. #[derive (Debug) ] 

i struct Person{ name: String } 

3. impl Person { 

4. fn new<T: Into<String>>(name: T) -> Person { 
5. Person {name: name.into() } 

6. } 

Pe } 

6. in Main 

9. let person = Person: :new ("Alex"); 

Ll, let person = Person: new “Alex”. to string) ) 3 
11 Prolene, Person) 2 


上 
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征 &str 关 型 或 String 关 型 ， 方 便 进 行 开 及 。 使 用 了 < 过 IT: Into<String>> 
限定 就 意味 着 ， 实 现 了 into 方 法 的 类 型 都 可 以 作为 参数 。&str 和 String 类 
型 都 实现 了 Into。 当 参数 是 &str 类 型 时 ， 会 通过 into 转 换 为 String 类 型 
当 参 数 是 String 类 型 时 ， 则 什么 都 不 会 友 生 。 

关于 IntoO 有 一 条 撩 认 的 规划 : 如 果 类 型 U 实 现 SFrom<T>, WT 
类 型 实例 调用 into 方 法 束 可 以 转换 为 类 型 U 。 这 是 因为 Rust 标 准 库 内 部 
有 一 个 默认 的 实现 ， 如 代码 清单 3-71 所 示 。 

代码 清单 3-71: 为 所 有 实现 了 From 二 T> 的 类 型 T 实 现 Into 二 U> 


impl<T, U> Into<U> for T where U: From<T> 


代码 清单 3-72 通 过 String 和 &str 类 型 展示 了 这 条 规则 。 
代码 清单 3-72: 可 以 使 用 into 方 法 将 &str 类 型 转换 为 String 类 型 


L. fn main() { 

2 let a= "hello"; 

3. let b: String = a.into(); 
4 } 


String 关 型 实现 了 From<&str 之 ， 所 以 可 以 使 用 into 方 法 将 &str 转 换 
为 String。 图 3-10 形 象 地 展示 了 From 和 Into 的 关系。 


From<T> 
°C ————— um 
T 
2° 
Iinto<U> 
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图 3-10: From 和 Into 的 关系 
所 以 ， 一 般 情 况 下 ， 只 需要 实现 From 即 可 ， 除 非 From 不 容易 实 


现 ， 才 需要 考虑 实现 Into。 

在 标准 库 中 ， 还 包含 了 TryFrom 和 TryInto 两 种 trait， 是 From 和 
Into 的 错误 处 理 版 本 ， 因 为 类 型 转换 是 有 可 能 发 生 错 误 的 ， 所 以 在 需要 
进行 错误 处 理 的 时 候 可 以 使 用 TryFrom 和 TryInto 。 不 过 TryFrom 和 
TryInto 目前 还 是 实验 性 特性 ， 只 能 在 Nightly 版 本 下 使 用 ， 在 不 久 的 将 
来 也 许 会 稳定 。 

另外， 标准 库 中 还 包含 了 AsRef 和 AsMut 两 种 trait， 可 以 将 值 分 别 
转换 为 不 可 变 引 用 和 可 变 引 用 。AsRef 和 标准 库 的 男 外 一 个 Borrow trait 
功能 有 些 类 似 ， 但 是 AsRef 比 较 轻 量 级 ， 它 只 是 简单 地 将 值 转换 为 引 
用 ， 而 Borrow ”trait 可 以 用 来 将 某 个 复合 类 型 抽象 为 拥有 信用 语义 的 类 
型 。 更 详细 的 内 容 请 参考 标准 库 文 档 。 


3.6 当前 trait 系 统 的 不 足 


虽然 当前 的 trait 系 统 很 强大 ， 但 依然 有 很 多 需要 改进 的 地 方 ， 主 要 
包括 以 下 三 反 : 

抓 儿 规 则 的 局 限 性 。 

代码 复 用 的 效率 不 局 。 

抽象 表达 能 力 有 行 改 进 。 

fe RRA ATW EK 


3.6.1 HKJ LAR EY Jeg BR TE 


JN) LAU) Be PATE — FE PERE EEF Y traith- ME, (AE ERA E 
局 限 性 。 
在 设计 trait 时 ， 还 需要 考 碟 是 否 会 影响 下 游 的 使 用 者 。 比 如 在 标准 
库 实 现 一 些 trait 时 ， 还 需要 考虑 是 含 需 要 为 所 有 的 T 或 和 a T 实 现 该 
trait， 如 代码 清单 3-73 所 示 。 
代码 清单 3-73: HAART’ aTIT 实 现 Bar trait 
le impl<T':Foo> Bar for T { } 
2. inpl<"a,TsBare Bar for paT] 


HF Rv crate it, GFR RE eae Se) LU ee, A ZH 
用 NewType 模 式 或 者 其 他 方式 将 远程 类 型 包装 为 本 地 类 型 。 这 就 禹 来 了 
很 多 不 便 。 

为 外 ， 对 于 一 些 本 地 类型 ， 如 果 将 其 放 到 一 些 容 右 中 ， 比 如 Rc 二 T 
或 Option 二 T 二 >>， 那么 这 些 本 地 类 型 灰 会 变 成 远程 类 型 (如 代码 清 单 
3-74 所 示 ) ， 因 为 这 些 容器 类 型 都 是 在 标准 库 中 定义 的 ， 而 非 本 地 。 

代码 清单 3-74: Option 二 T 会 将 本 地 类 型 变 成 远程 类 型 


ls ise std! tops Ad 

EA # [derive (PartialEq) ] 

Ss Scrum. Int liszy 

4. inol Add<i32z> [or Int 4 

5, type Output = 132; 

6. te addi(seLr, other: 132) -> Self: Output 1 
ae (self.0) + other 

B. } 

9, } 

LO. Z7 ampl Addis A> for Option<int | 

lle y YY TODO 

LA fe } 

La. ampl Ada<132> for Box TE f 

14. type Output = 132; 

| tt gcdatselr, OLcher: 152) => Bell: rOoureur i 
LS. (self.0) + other 

LR } 

Lo, J 

LS. itn Main () 1 

20. Det eg! (INtA3) + 3, 0)? 

Ales aSSere Sg: (Boxe new (Tmt (s)) + 2, ©: 
Zs } 


Sis 3-74 fe AH BE SAE MAA Int, Ma A SELAd 
trait. Add ”trait 是 定义 于 标准 库 中 的 ，Int 是 在 本 地 的 ， 所 以 并 不 违反 孤 
儿 规 则 。 

但 是 当 给 Option<Int> SEE, Add 时 ， 编 详 器 吏 会 报销 ， 因 为 触发 
了 孤儿 规则 。 如 代码 第 10 行 到 第 12 行 所 示 。 

但 是 当 给 Box 二 nt 二 实现 Add 时 ， 则 可 以 正常 编译 执行 。 如 代码 第 
20 行 和 第 21 行 所 示 。 看 到 这 里 是 不 是 有 些 困惑 ? 

这 是 因为 Box 雪 工 > 在 Rust 中 属于 最 第 用 的 次 型 ， 经 彰 会 过 到 像 代 码 
清单 3-74 这 样 的 情况 : 从 子 crate 为 Box 二 Int 二 这 种 自 定义 类 型 扩展 trait 实 
现 。 标 准 库 中 根本 做 不 到 和 腹 产 所 有 有 的 crate 中 的 各 种 可 能 性 ， 所 以 必须 将 


Box<T> 开 放出 来 ， 脱 离 孤 儿 规则 的 限制 ， 和 否则 就 会 限制 子 crate 要 实 
现 的 一 些 功能 。 
那么 ，Box 二 TT 二 是 怎么 做 到 如 此 特殊 的 呢 ?” 这 其 实 是 因为 Rust A 
部 使 用 了 一 个 叫 # [fundamental] 的 属性 标识 ，Box< 工 > 的 实现 源 但 如 
代码 清单 3-75 所 示 。 
代码 清单 3-75: Box< 工 > 实现 源码 示意 
ill # [fundamental] 
2 pub struct Box<T: ?Sized>(Unique<T>) ; 


Mais 3-75 展示 了 Box< 工 > 的 源码 示意 ， 可 以 看 到 其 定义 上 方 
PRIR Y # [fundamental] 属性 ， 访 属性 的 作用 融 是 告诉 编 详 项 ，Box<T 
> RAR, ATE DED LLY 

Ke J Box<T>, “AFn. FnMut, FnOnce, Sized AhI0_E s # 
[fundamental] 属性 ， 代 表 这 些 trait 也 同样 不 受 孤 儿 规 则 的 限制 。 所 以 ， 
在 阅读 Rust 源 码 的 时 候 ， 如 果 看 到 该 属性 标识 ， 就 应 该 知道 它 和 和 孤儿 规 
WER. 


3.6.2 代码 复 用 的 效率 不 高 


除了 孤儿 规则 ，Rust 其 实 还 遭 循 妃 外 一 条 规则 : ELS C Overlap ) 
规则 。 访 规则 规定 了 不 能 为 重 倒 的 类 型 实现 同一 个 trait。 什 么 叫 重 登 的 
类 型 ? 如 代码 清单 3-76 所 示 。 
代码 清单 3-76: ESWARA 
il. Emp LlLAT> My Fadi for T dwl 


cp impl<T> AnyTrait for T where T: Copy {...} 
4. inp l<T> ANVIFaLlt EOE 132 fes] 


代码 清单 3-76 中 分 别 为 三 种 类 型 实现 了 AnyTrait。 

Tez, ANMA aR. 

- T where T: Copy 和 是 受 trait 限 定 约束 的 汉 型 T， 指 代 实 现 了 Copy 的 
一 部 分 T， 是 所 有 类 型 的 子 集 。 

“i32 是 一 个 具体 的 类 型 。 

wma. ESR RE ER. TAS ST: Copy, mT: 


Copy 包 含 了 i32。 这 违反 了 重 羞 规则， 所 以 编译 会 失败 。 这 种 实现 trait 
的 方式 在 Rust FUA IKEL (Blanket Impl) 

HS ALI AI LE EE AEN S mitrat iE, WE a A AE E 
BL, (Ae Ew aK feel el, ERA RASA: 

性 能 问题 。 

. (RIBAR XE E H o 

性 能 会 有 什么 问题 呢 ? 且 看 一 个 示例 ， 如 代码 清单 3-77 所 示 。 

代码 清单 3-77: AWA RATS WAddAssign 

m impl<R, T: Add<R> + Clone> AddAssign<R> for T { 


Ba in add assign (amut self, rhs: R) { 
a. let tmp = self.clone() + rhs; 
4. *self = tmp; 
as } 
6 } 


FEM Sis 3-777, APRA RATSCH Sf AddAssign, itraitze X H 
add_assign A iA Æ +=HUBERTE MAA E. AFERM BRA, (Hee 
来 性 能 问题 ， 因 为 会 强制 所 有 类 型 都 使 用 Clone 方法 ，clone 方 法 会 有 一 
定 的 成 本 开销 ， 但 实际 上 有 的 类 型 并 不 需要 clone。 因 为 有 重 登 规则 的 限 
制 ， 不 能 为 条 些 不 需要 clone “的 具体 类 型 重新 实现 add_assign 方 法 。 所 
以 ， 在 标准 库 中 ， 为 了 实现 更 好 的 性 能 ， 只 好 为 每 个 具体 的 类 型 都 各 目 
SE Th, — td Add Assign. 

WANs 3-77 BEBER, BE LU) PE) AREA H 
We FP, WRAL, WAT DERE Eri T HKR, 
然后 对 不 需要 clone 的 类 型 重新 实现 AddAssign， 那 么 束 完 全 没 必 要 为 每 
个 具体 类 型 都 实现 一 授 add_assign 方 法 ， 可 以 省 挥 很 多 午 复 代码 。 妆 
然 ， 此 处 只 是 为 了 说 明 重 奢 规 则 的 问题 ， 实 际 上 在 标准 库 中 会 使 用 宏 来 
人 简化 其 体 的 实现 代码 。 

那么 为 了 绥 解 重 登 规则 市 来 的 问题 ，Rust 引入 了 特 化 
(Specialization ) 。 特 化 功能 暂时 只 能 用 于 impl 实 现 ， 所 以 也 称 为 impl 
特 化 。 不 过 该 功能 目前 还 未 稳定 发 布 ， 只 能 在 Nightly 版 本 的 Rust 之 下 使 


Fat! [feature (specialization) ] 特性 。 
trait 包 含 默 认 实 现 的 特 化 示例 如 代码 清 蛙 3-78 所 示 。 
代码 清单 3-78: trait 包 含 默认 实现 的 特 化 示例 


1. #![feature (specialization) | 

2s Struct Diver<T> 1 

3. inner: T, 

4. } 

5. trait Swimmer { 

6. fn swim(é&self) { 

iA printin! ("Swimming") 

8. } 

9 | 

10. impl<T> Swimmer for Diver<T> {} 

11. impl Swimmer for Diver<&'static str> { 
Le. fn swim(é&self) { 

Ly println! ("drowning, help!") 

14. } 

Le. 3 

16. fn main() { 

Les let x = Diveni ese" static sre> | immers "Bob" Ty 
18. x.swim(); // drowning, help! 

19. let ¥ = Diver: :<String> | lfiners Strang:*from("Alice”) }; 
20, y.swim(); // swimming 

Bae 


在 代码 清单 3-78 中 ， 定 义 了 一 个 泛 型 结构 体 Diver<T>, UR — 
AS Here ERA SEEM AN Swimmer trait. jp NDiver<T> ÆI J trait, WW 
第 10 行 所 示 。 

代码 第 11 行 到 第 15 行 为 Diver<& static str 盖 实现 了 Swimmer。 

然后 在 main 哨 数 中 分 别 调 用 Diver: : <&’ static str 之 和 Diver: 
二 String 二 类 型 的 swim 方 法 ， 输 出 不 同 的 结果 。 

看 得 出 来 ， 特 化 功能 有 点 类 似 面 同 对 象 语言 中 的 继承 ，Diver: 
<String > “4k 7K” Y Diver: : 雪 工 > 中 的 实现 。 而 Diver: : <&’ static 


str> UEH SAS swim ESE. 
代码 清 单 3-78 展 示 了 trait 默 认 实 现 的 情况 。 如 果 trait 没 有 默认 实现 ， 
特 化 功能 的 与 法 琵 会 稍微 有 点 区 别 ， 如 代码 清单 3-79 所 示 。 
代码 清单 3-79: trait 没 有 默认 实现 的 特 化 示例 
1. // 其 他 代码 不 变 


2 trait Swimmer { 

3 fn swim(é&self); 

4 } 

3 impl<T> Swimmer for Diver<T> { 
6. default fn swim(&self) { 

7 printin! ("swimming") 

8 } 

g. } 

10. // 其 他 代码 不 变 


代码 清单 3-79 是 对 代码 清单 3-78 进 行 的 修改 。 将 原本 Swimmer 中 的 
驮 认 实 现 去 掉 ， 然 后 在 为 Diver<T 工 > 实现 Swimmer 的 时 候 编 写 具 体 的 
swim 实 现 。 请 注意 这 里 多 了 一 个 default ”关键 字 。 代 人 码 清 单 3-78 中 其 余 
的 代码 保持 不 变 。 

如 果 不 加 default， 编 译 会 报错 。 这 是 因为 默认 impl 块 中 的 方法 不 
可 被 特 化 ， 必 须 使 用 default 天 键 字 来 标记 那个 需要 被 特 化 的 方法 ， 这 是 
出 于 代码 的 羔 容 性 考虑 的 。 同 时 ， 通 过 显 式 地 使 用 default 标 记 ， 也 增强 
了 代码 的 维护 性 和 可 讯 性。 

目前 特 化 的 功能 还 在 不 断 地 演进 和 完善 ， 在 不 远 的 将 来 会 稳定 发 
布 。 到 时 候 Rust 代 码 的 性 能 和 重用 性 将 会 孙 背 提高 ， 而 且 在 特 化 的 文 持 
下 ， 还 可 能 会 实现 高 效 的 继承 方案 。 让 我 们 拭目以待 。 

3.6.3 抽象 表达 能 力 有 竺 改进 

欠 代 需 在 Rust 中 应 用 广泛 ， 但 是 它 目 前 有 一 个 缺陷 : PETA TORRY 
时 候 ， 吕 能 按 值 进行 迭代 ， 有 的 时 候 必 须 重 新 分 配 数 据 ， 而 不 能 通过 


引用 来 复 用 原始 的 数据 o 比如 标准 库 中 的 std: : 10: : Lines 类 型 用 于 
按 行 谈 取 文件 数据 ， 但 是 该 实现 适 代 右上 只 能 读 一 行 数 据 分 配 一 个 新 的 


String, MAE AX. i PERE. PERI AIAN 
An AHORA Al AE SE ERORITA 

XE AAS aS HY SESE T RRR, MOCK a! a A pe cap A 
WARA, MAN RESCH YZ A. NRSC RZ A m BE ci | RA, 
因为 Rust 里 规定 使 用 引用 类 型 必须 标明 生命 周期 参数 ， 而 生命 周期 参数 
恰恰 是 一 种 泛 型 其 型 参数 。 

为 了 解雇 这 个 问题 ， 束 必须 允许 欠 代 亏 文 持 引 用 类 型 。 只 有 文 持 引 
用 关 型 ， 才 可 以 重用 丹 部 缓存 区 ， 而 不 需要 重新 分 配 新 的 内 存 。 所 以 ， 
惑 必 须 实 现 一 种 更 高 级 别 的 次 型 多 态 性 ， 即 汉 型 关联 关 型 (Generic 
Associated Type, GAT) Bl, ， 如 代码 清单 3-80 所 示 。 

代码 清单 3-80: 文 持 GAI 的 trait 实 现 示例 


l. trait StreamingIterator { 
2. type Item<'a>; 
Ds fn next<'a>(&'a mut self) -> Option<Self::Item<'a>>; 


4. } 


我 们 在 代码 清单 3-80 HEX SPIE Tas Streaminglterator, ‘ELM 
Pee Siz RRR, XE Item<! a> Py’ a Wæ pp 
关 型 参数 ， 叫 作 生 命 周 期 参数 ， 表 示 这 里 可 以 使 用 引用 。 

这 样 一 来 ， 如 果 给 std: : io: : Lines 实 现 了 Streaminglterator 迭 代 
器 ， 它 就 可 以 复 用 内 存 缓存 区 ， 而 不 需要 为 每 行 数据 新 开辟 一 份 内 存 ， 
因而 提升 了 性 能 。 

Item<′a> 古 一 种 类 型 构造 需 。 束 像 Vec 二 本 > 类型， 只 有 在 为 其 
指定 具体 的 类 型 之 后 才 算 一 个 真正 的 类 型 ， 比 如 Vec<i32> 之 。 所 
Lh, GAT 也 被 称 为 ACT (Associated type constructor ) ， 即 关联 类 型 
构造 器 。 

但 遗憾 的 是 ， 目 前 GAT 功能 还 在 案 张 地 实现 中 ， 还 不 能 使 用 。 在 
不 久 的 将 来 ，GAT 稳定 功能 会 税 友 布 ， 到 时 低 将 进一步 提升 Rust 类 型 系 
统 的 抽象 能 


3.7 小 结 


KERR S Ruste Ay Ht ESS RA: 从 通用 概念 开始 ， 介 绍 了 什 
么 是 类 型 系统 、 类 型 系统 的 种 类 、 类 型 系统 中 的 多 态 等 ;然后 逐步 探索 
了 Rust 中 的 次 型 系统 。 如 果 没 有 类 型 系统 ，Rust 语 言 的 安全 基石 将 不 复 
存在 。 通 过 学 习 本 章 ， 可 以 对 Rust 的 类 型 系统 建立 完善 的 心智 模型 
(Mental Model ) ， 为 彻 展 和 萤 握 Rust 打 下 重要 的 基础 。 

Rust 除 了 使 用 次 型 系统 来 存储 信息 ， 还 试图 将 信息 处 理 过 程 中 的 各 
种 行为 部 纳 入 类 型 系统 ， 以 防止 未 定义 的 行为 友 生 。 如 果 讽 类 型 系统 
是 “法 律 ?， 那 么 编译 医 吏 是 Rust 类 型 系统 世界 中 最 严格 的 “执法 者 >”。 编 
译 硕 在 编译 期 进行 严格 的 类 型 检查 ， 保 证 了 Rust 的 内 存 安 全 和 并 发 安 
ase 

Rust 的 类 型 系统 也 是 其 “ 零 成 本 抽象 ”的 保证 。trait 是 Rust 中 Ad-hoc 多 
态 的 实现 ，trait 可 以 进行 接口 抽象 ， 对 泛 型 进行 限定 ， 文 持 毅 态 分 发 。 
trait 也 模糊 了 类 型 和 行为 的 界限 ， 让 开发 者 可 以 在 多 种 类 型 之 上 按照 行 
为 统一 抽象 为 抽象 类 型 。 抽 和 象 类 型 支 持 trait 对 象 和 impl Trait 语 法 ， 分 
别 为 动态 分 发 和 议 态 分 发 。 

好 后 ， 我 们 了 解 了 Rust 中 的 隐 式 类 型 转换 和 显示 类 型 转换 的 区 别 和 
各 目的 方法 。 其 中 隐 式 类 型 转换 基本 上 只 有 目 动 解 引 用 ， 它 是 为 了 们 化 
编程 而 提供 的 。 跟 其 他 弱 类 型 语言 中 的 隐 式 类 型 转换 不 一 样 ，Rust 中 且 
隐 式 类 型 转换 是 类 型 安全 的 。 通 过 as 关 键 字 可 以 对 原生 类 型 进行 安全 的 
显示 转换 ， 但 对 一 些 自 定义 类 型 ， 还 需要 实现 AsRef 或 FromyInto 这 样 的 
trait 来 支持 显 式 类 型 转换 。 





[1] 这 里 只 是 从 广义 上 来 定义 强 类 型 和 弱 类 型 。 事 实 上 Rust 也 包含 自动 隐 式 转换 ， 本 章 后 面 会 讲 到 。 
[2] C 语 言 中 的 memepy 会 从 源 所 指 的 内 存 地 址 的 起 始 位 置 开始 拷贝 n 个 字 节 ， 直 到 目标 所 指 的 内 存 地 址 的 起 始 位 置 。 
可 以 拷贝 任意 类 型 ， 主 要 是 栈 拷贝 


BAE ANTE 


清 衬 你 的 杯子 ， 方 能 再 行 注 满 ， 衬 无 以 求全 。 

在 现代 计算 机 体系 中 ， 内 存 是 很 重要 的 部 件 之 一 ， 程 序 的 运行 离 不 
开 和 内存。 不 同 的 编程 语言 对 内 存 有 看 不 同 的 管理 方式 。 按 照 内 存 的 管理 
方式 可 将 编程 语言 大 致 分 为 两 并: 手动 内 存 管 理 类 MAAR eH 
。 手 动 内 存 党 理 类 需要 开发 者 手动 使 用 malloc 和 free 等 图 数 雍 式 管理 内 
人 存 ， 比 如 C 语 言 。 目 动 内 存 管 理 类 使 用 GC (Garbage Collection, Hit El 
Wo) 来 对 内 存 进行 目 动 化 害 理 ， 而 无 须 开 发 者 手动 开放 和 释放 内 存 ， 比 
diJava, C#. Ruby, Pythoni8 A ah GCH Ate HAH. 

手动 内 存 管理 的 优势 在 于 性 能 ， 因 为 可 以 直接 操控 内 存 ， 但 同时 也 
带 来 不 少 问 题 。 有 人 的 地 方 就 有 Bug， 即 使 是 C/C++ 语言 高 手 ， 在 写 了 
上 和 干 行 代码 之 后 ， 也 会 有 息 记 释放 内 存 的 情况 ， 束 有 可 能 频 党 地 造成 内 
Fii © OA He EN —A DL et EAE TS (Dangling 
Pointer) 。 如 果菜 个 指针 引用 的 内 存 被 非法 释放 皖 了 ， 而 该 指针 却 依旧 
Ta ALTE ATE, ToL RASS EN ESET. OR ESET 
ay We eT TT ROR EP ET CIE TIVE Ja o 

GC 目 动 内 存 管理 接管 了 开 用 者 分 配 和 回收 内 存 的 任务 ， 并 帮助 提 
升 了 代码 的 抽象 度 和 可 靠 性 。 像 合算 指针 之 类 的 问题 完全 可 以 避免 ， 
为 一 个 和 被 引 用 的 对 象 的 内 存 永远 不 会 被 释放 ， 只 有 当 它 不 伞 引 用 时 才 可 
被 回收。GC 使 用 了 各 种 精确 的 算法 来 解决 内 存 分 配 和 回收 的 问题 ， 但 
并 不 代表 能 解决 所 有 的 问题 。GC 最 大 的 问题 是 会 引起 “世界 暂停 >，GC 
在 工作 的 时 候 必 须 保证 程序 不 会 引入 新 的 “垃圾 ”， 所 以 要 使 运行 中 的 程 
FR, etre a SPE RE Tal pel. 

所 以 ， 编 程 语 言 的 使 用 现状 融 是 ， 对 性 能 要 求 高 并 且 需 要 对 内 人 存 进 
行 精 确 操控 的 系统 级 开 及 ， 一 般 只 能 选择 C 和 C++ 之 类 的 语言 ， 存 在 的 
问题 是 ， 如 果 开 发 者 和 不 留神 束 会 造成 内 存 不 安全 问题 。 其 他 类 型 的 开 
发 束 选 择 Java、Python、Ruby 之 类 的 融 级 语言 ， 一 般 不 会 出 现 内 存 不 安 
全 有 的 问题 ， 但 是 它们 的 性 能 却 降低 了 不 少 。 

有 没有 一 门 语言 能 够 将 两 者 的 优势 结合 起 来 ， 做 到 既 无 GC 又 可 以 
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般 进 行 快 速 开 上 友 呢 ? 答案 考 庸 置疑， 有 ， 束 是 Rust。 作 为 一 门 强大 的 系 
统 编 程 语言 ，Rust 允 许 开 友 痢 耳 接 操控 内 存 ， 所 以 了 解 内 存 如 何 工作 对 
于 编写 出 高 效 的 Rust 代 码 至 关 重 要 。 


4.1 通用 概念 


现代 操作 系统 在 保护 模式 下 都 采用 虚拟 内 存 管 理 技术 。 虚 拟 内 存 是 
一 种 对 物理 存储 设备 的 统一 抽象 ， 其 中 物理 存储 设备 包括 物理 内 存 、 磁 
稚 、 寄 存 堪 、 高 速 缓存 等 。 这 样 统一 抽象 的 好 处 是 ， 方 便 同 时 运行 多 道 
程序 ， 使 得 每 个 进程 都 有 各 自 独 立 的 进程 地 址 空间 ， 并 且 可 以 通过 操作 
系统 调度 将 外 存 当 作 内 存 来 使 用 。 这 就 引出 了 一 个 新 的 概念 : 虚拟 地 址 
空间 。 

虚拟 地 址 空间 是 线性 空间 ， 用 户 所 接触 到 的 地 址 都 是 虚拟 地 址 ， 而 
不 是 真实 的 物理 地 址 。 利 用 这 种 虚拟 地 址 不 但 能 保护 操作 系统 ， 让 进程 
在 各 自 的 地 址 空间 内 操作 内 存 ， 更 重要 的 是 ， 用 户 程 序 可 以 使 用 比 物理 
内 存 更 大 的 地 址 空间 。 虚 拟 地 址 空间 被 人 为 地 分 为 两 部 分 :用户 空 间 
和 内 核 空 间 ， 它 们 的 比例 是 3: 1 (Linux 系 统 中 ) 或 2: 2 (Windows 系 
统 中 ) 。 以 Linux 系 统 为 例 ，32 位 计算 机 的 地 址 空间 大 小 是 4GB， 寻 址 
范围 是 0x00000000~~0xFFFFFFFF。 然 后 通过 内 存 分 页 等 底层 复杂 的 机 
制 来 把 虚拟 地 址 翻译 为 物理 地 址 ， 如 图 4-1 所 示 。 


虚拟 地 址 空间 
OxFFFFFFFF 
1GB 内 核 室 间 


: mmap 内 存 映 射 区 : 
> 





图 4-1: Linux 系 统 中 的 虚拟 地 址 空间 示意 图 
图 4-1 是 Linux 虚 拟 地 址 空间 的 示意 图 ， 其 中 值得 注意 的 是 用 户 空 间 


中 的 栈 (stack ) 和 堆 Cheap ) 。 图 中 箭头 的 方向 代表 内 存 增长 的 方 
向 ， 栈 向 下 (由 高 地 址 向 低地 址 ) 增长 ， 堆 向 上 (由 低地 址 向 高 地 址 ) 
增长 出 ， 这 样 的 设计 是 为 了 更 加 有 效 地 利用 内 存 。 关 于 虚拟 内 存 的 其 
他 细节 不 在 本 章 讨论 范围 内 ， 因 此 不 展开 讲述 。 


4.1.1 栈 


栈 (stack) ， 世 被 称 为 堆栈 ， 但 是 为 了 避免 上 收 义 ， 本 书 只 称 其 为 
栈 。 栈 一 般 有 两 种 定义 ， 一 种 是 指数 据 结构 ， 一 种 是 指 栈 内 存 。 

在 数据 结构 中 ， 栈 是 一 种 特殊 的 线性 表 ， 如 图 4-2 所 示 。 其 特殊 性 
在 于 限定 了 插入 和 删除 数据 只 能 在 线性 表 回 定 的 一 疾 进 行 。 

图 4-2 展 示 了 栈 的 特性 ， 操 作 栈 的 一 六 被 称 为 栈 顶 AS A sr 
PIFRE 。 从 栈 顶 压 入 数据 叫 入 栈 (push ) ， 从 栈 顶 弹出 数据 叫 出 栈 
(pop ) ， 这 意味 看 最 后 一 个 入 栈 的 数据 会 第 一 个 出 栈 ， 所 以 栈 被 称 为 
后 进 先 出 (LIFO，Last in First Out) 线性 表 。 


A (push) 





图 4-2: 栈 示意 图 
物理 内 存 本 号 并 不 区 分 堆 和 栈 ， 但 是 虚拟 内 存 空间 需要 分 出 一 部 分 
内 存 ， 用 于 文 持 CPU 入 栈 或 出 栈 的 指令 操作 ， 这 部 分 内 存 空间 就 是 栈 内 
存 ”“。 栈 内 存 拥 有 和 栈 数据 结构 相同 的 特性 ， 文 持 入 栈 和 出 栈 操作 ， 数 
据 压 入 的 操作 使 栈 顶 的 地 址 减少 ， 数 据 弹 出 的 操作 使 栈 顶 的 地 址 增多 ， 
如 图 4-3 所 示 。 


虚拟 地 址 空间 
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图 4-3: 栈 内 存 示 意图 
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据 入 栈 时 ， 栈 顶 地 址 向 下 增长 ， 地 址 由 高 地 址 变 成 低地 址 ， 当 有 数据 被 
弹出 时 ， 栈 顶 地 址 同上 增长 ， 地 址 由 低地 址 变 成 高 地 址 。 因 此 ， 降 低 
ESP 的 地 址 等 价 于 开辟 栈 空间 ， 增 加 ESP 的 地 址 等 价 于 回收 栈 空 间 。 

栈 内 存 最 重要 的 作用 是 在 程序 运行 过 程 中 保存 图 数 调 用 所 要 维护 
的 信息 ”“。 存 储 每 次 函数 调用 所 需 信 息 的 记录 单元 被 称 为 栈 帆 《Stack 
Frame ， 如 图 4-4 所 示 )〉 ， 有 时 也 被 称 为 活动 记录 (Activate Record 
) 。 因 此 栈 内 存 被 栈 帆 分割 成 了 N 个 记录 块 ， 而 且 这 些 记 录 块 都 是 大 小 
A 


保存 的 寄存 器 


局 部 变量 





图 4-4: 栈 帧 示意 图 
栈 帧 一 般 包 括 三 方面 的 内 容 : 
函数 的 返回 地 址 和 参数 。 
临时 变量 LFA R BBC a HY SEREAS Jeg aD EA hg > se PAE EY I ES 


: 保存 的 上 下 文 。 

EBP 指针 是 帧 指针 (Frame Pointer ) ， 它 指 癌 当前 栈 帆 的 一 个 回 
定 的 位 置 ， 而 ESP 始 终 指向 栈 顶 。EBP 指 向 的 值 是 调用 该 函数 之 前 的 旧 
的 EBP 值 ， 这 样 在 函数 返回 时 ， 束 可 以 通过 该 值 恢 复 到 调用 前 的 值 。 由 
EBP 指针 和 ESP 指针 构成 的 区 域 束 是 一 个 栈 帆 ， 一 般 是 指 当 前 栈 帆 。 

栈 帧 的 分 配 非 党 快 ， 其 中 的 局 部 变量 都 是 预 分 配 内 存 ， 在 栈 上 分 配 
的 值 都 是 可 以 预先 确定 大 小 的 类 型 。 当 函数 结束 调用 的 时 候 ， 栈 帧 会 被 
目 动 释放 ， 上 所 以 栈 上 数据 的 生命 周期 都 是 在 一 个 函数 调用 周期 内 的 。 

我 们 可 以 通过 一 个 具体 的 代码 示例 来 了 解 上 述 过 程 。 代 人 码 清单 4-1 
展示 了 一 个 函数 调用 过 程 ， 访 程序 由 foo 国 数 和 main 函 数组 成 ， 其 中 包 
括 X、y 和 z 三 个 变量 。 

代码 清 单 4-1: 通过 简单 函数 调用 展示 栈 帧 


tn Toots: waz) | 
let y = x; 
let z = 100; 

} 

fw main) 4 
let x = 42; 
LOG (32) 2 

} 


代码 清单 4-1 中 的 main AANA ORG PA H. main 
数 中 声明 了 变量 x， 在 调用 foo 疯 数 前 ，main 函 数 先 在 栈 里 开放 了 空间 ， 
压 入 了 x 杰 和 量 。 栈 帧 里 EBP 指 问 起 始 位 置 ， 变 量 X 保 存在 帆 指 针 EBP- 

(只 是 为 了 演示 ) MEAE. 

在 调用 foo 函数 时 ， 将 返回 地 址 压 入 栈 中 ， 然 后 由 PC 指针 《程序 
计数 器 ) 引导 执行 函数 调用 指令 ， 进 入 foo 函 数 栈 帧 中 。 此 时 同样 在 栈 
中 开辟 空间 ， 依 次 将 main 函 数 的 EBP 地 址 、 参 数 x 以 及 局 部 变量 yx 和 z 压 
入 栈 中 。EBP 指 针 依 旧 指 同 地 址 为 0 的 固定 位 置 ， 表 明 当 前 是 在 foo 函 数 
栈 帧 中 ， 通 过 EBP-4、EBP-8 和 EBP-12 就 可 以 访问 参数 和 变量 。 当 foo 函 
数 执行 完毕 时 ， 其 参数 或 局 部 变量 会 依次 弹出 ， 和 直到 得 到 main 函 数 的 
det 束 可 以 跳 回 main 函 数 栈 帆 中 ， 然 后 通过 返回 地 址 整 可 以 继续 
执行 main 函 数 中 其 余 的 代码 了 ， 这 个 过 程 如 图 4-5 所 示 。 


VFR foo ph ef i 18 FRfooh BUS 





图 4-5: 函数 调用 栈 帆 示意 图 

在 上 述 过 程 中 ， 调 用 main 和 foo 浮 数 时 ， 栈 项 ESP 地 址 会 降低 ， 因 为 
要 分 配 栈 内 存 ， 栈 问 下 增长 ， 当 foo 孙 数 执行 完毕 时 ，ESP 地 址 会 增长 ， 
ALAR AI Se RET Ba A ES ET, PB ACY Jy SAR ee TH eR 
释放 ， 所 以 可 想 而 知 ， 全 局 变量 不 会 锐 存 储 到 栈 中 。 访 过程 说 来 简 
单 ， 但 其 实 展 层 涉及 寻 址 、 寄 存 郁 、 汇 编 指 令 等 比较 复杂 的 协作 过 程 ， 
I EG A ce FA in PE as BA Eas BOSC RA, MPRA RAR, Awe 
了 解 栈 内 存 的 工作 机 制 即 可 。 

栈 内 存 的 工作 方式 是 一 个 通用 概念 ， 不 仅仅 适用 于 Rust 语 言 ， 也 适 
用 于 其 他 编程 语言 。 


4.1.2 HE 
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一 种 十指 堆 内 存 。 

在 数据 结构 中 ， 堆 表示 一 种 特殊 的 树 形 数据 结构 ， 特 殊 之 处 在 于 此 
WERE W, EWR REKTAL RK TANT TEAN 
值 ， 称 为 大 项 堆 ; 要 么 部 小 于 两 个 子 市 把 的 值 ， 称 为 小 项 堆 。 一 般 用 


于 实现 堆 排 序 或 优先 队列 。 栈 数据 结构 和 栈 内 存在 特性 上 还 有 所 关联 ， 
但 堆 数 据 结构 和 堆 内 存 并 无 直接 的 联系 。 

栈 内 存 中 保存 的 数据 ， 生 命 周 期 都 比较 短 ， 会 随 看 函数 调用 的 完成 
而 消亡 。 但 很 多 情况 下 会 需要 能 相对 长 久 地 保存 在 内 存 中 的 数据 ， 以 便 
踪 疯 数 使 用 ， 这 束 是 堆 内 存 发 挥 作用 的 地 方 。 堆 内 存 是 一 块 巳 大 的 内 存 
空间 ， 占 了 虚拟 内 存 空间 的 绝 大 部 分 。 程 序 不 可 以 主动 申请 栈 内 存 ， 但 
可 以 主动 申请 推 内存。 在 推 内 存 中 存放 的 数据 会 在 程序 运行 过 程 中 一 二 
IFE, BRIE A AK EEE OE 

ECER P, Fer n By DOR al H malloc esi BOK AS HEA FF, FEB 
以 通过 free 函 数 来 释放 它 ;， ECHES P, A DE Anew A#lldelete rk 2 . 
包含 GC 的 编程 语言 则 是 由 GC 来 分 配 和 回收 堆 内 存 的 。 

在 实际 工作 中 ， 对 于 事先 知道 大 小 的 类 型 ， 可 以 分 配 到 栈 中 ， 比 如 
国定 大 小 的 数组 。 但 是 如 果 和 需要 动态 大 小 的 数组 ， 则 需要 使 用 堆 内 存 。 
开发 者 只 能 通过 指针 来 掌握 已 分 配 的 堆 内 存 ， 这 本 刁 束 市 来 了 安全 隐 
Re, Weta et fa [Al YEA OE ESET A OM IE AH, BS AT 
针 指 癌 一 个 不 合法 的 内 存 ， 束 会 带 来 内 存 不 安全 问题 。 所 以 ， 面 癌 对 象 
大 师 Bertrand Meyer 12] 才 会 说 : “要 么 保证 软件 质量 ， 要 么 使 用 指针 ， 
PA a AS A EG.” 

推 是 一 大 块 内 存 空 间 ， 程 序 通 过 malloc 申 请 到 的 内 存 空 间 是 大 小 不 
一 、 不 连续 日 无 序 的 ， 所 以 如 何 管 理 堆 内 存 是 一 个 问题 。 这 束 涉 及 堆 分 
配备 法 ， 堆 分 配 算法 有 很 多 种 ， 束 本 质 而 言 可 以 分 为 两 大 类 : 空闲 链表 
(Free List ) 和 位 图 标记 (Bitmap ) 。 

空 用 链表 实际 上 束 是 把 堆 中 空 用 的 内 存 地 址 记录 为 链表 ， 当 系统 收 
到 程序 申请 时 ， 会 退 历 该 链表;， 妆 找到 适合 的 空间 堆 太 点 时 ， 会 将 此 市 
点 从 链表 中 删除 ， 妆 空间 被 回收 以 后 ， 再 将 其 加 到 空 用 链表 中 。 空 用 链 
表 的 优势 是 实现 人 简单， 但 如 果 链 表 遭 到 破坏 ， 整 个 堆 就 无 法 正常 工作 。 

位 图 的 核心 思想 是 将 整个 堆 划 分 为 大 量 大 小 相等 的 块 。 当 程序 申请 
内 存 时 ， 总 是 分 配 整 数 个 块 的 空间 。 每 块 内 存 都 用 一 个 二 进 制 位 来 表示 
其 状态 ， 如 果 变 内 存 侯 占用， 则 相应 位 图 中 的 位 置 置 为 1; RAE 
宇内 ， 则 相应 位 图 中 的 位 置 置 为 0。 位 多 的 优势 是 速度 快 ， 如 果 单 个 内 
存 块 数据 遭 到 和 破坏， 也 不 会 影响 整个 堆 ， 但 缺点 是 容易 产生 内 存 雁 卢 。 


不 管 是 什么 算法 ， 分 配 的 都 是 虚拟 地 址 空间 。 所 以 当 挫 空间 被 释放 
时 ， 并 不 代表 指 物理 空间 也 马上 被 释 放 。 挫 内 存 分 配 函 数 malloc 和 回 
收 函 数 free 背后 是 内 存 分 配器 (memory allocator) ， 比 如 glibc 的 内 存 分 
配器 ptmallac2， 或 者 FreeBSD 平 台 的 jemalloc。 这 些 内 存 分 配器 负责 管理 
申请 和 回收 推 内存， 当 扒 内 存 杰 放 时 ， 内 存 和 被 归还 给 了 内 存 分 配 需 。 内 
存 分 配 磊 会 对 空闲 的 内 存 进 行 统一 “整理 ”， 在 适合 《比如 空闲 内 存 达 到 
2048KB) 的 时 候 ， 才 会 把 内 存 归 还 给 系统 ， 也 就 是 指 释放 物理 空间 。 

Rust 编 译 右 目前 目 市 两 个 默认 分 配 右 : alloc_system 和 
alloc_jemalloc 。 在 Rust 2015 RÆ F, YERS ERIE AANE 
Halloc_jemalloc ($F BAT RED ac#Fjemalloc) , MA FRSA 
链接 库 ， 默 认 使 用 alloc_system。 在 Rust 2018 版 本 和 下， 默认 使 用 
alloc_system， 并 且 可 以 由 开发 者 上 自己 指派 Jemalloc 或 其 他 第 三 方 分 配 
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AN o 

Jemaloc H RAA LA RULE: 

:分配 或 回收 内 存 更 快速 。 

. AFERE., 

多 核 友 好 。 

- 民 好 的 可 伸缩 性 。 

Jemalloc 是 现代 化 的 业界 流行 的 内 存 分 配 解 决 方 采 ， 它 整 块 批发 内 
存 〈 称 为 chunk) 以 供 程序 使 用 ， 而 非 频 索 地 使 用 系统 调用 《比如 brk 
或 mmap) 来 同 操作 系统 申请 内 存 。 其 内 存 管理 采用 层级 架构 ， 分 别 是 
线程 缓存 tcache、 分 配 区 arena 和 系统 内 存 (system memory) ， 不 同 大 小 
的 内 存 块 对 应 不 同 的 分 配 区 。 每 个 线程 对 应 一 个 tcache，tcache frr 
前 线程 所 使 用 内 存 块 的 申请 和 释放 ， 训 人 免 线程 间 锁 的 苋 争 和 同步 。 
tcache 是 对 arena 中 内 存 块 的 绥 存 ， 当 疫 有 tcache 时 则 使 用 arena 分 配 内 
存 。arena 采 用 内 存 池 思想 对 内 存 区 域 进 行 了 合理 划分 和 管理 ， 在 有 效 保 
证 低 科 户 的 前 提 下 实现 了 不 同 大 小 内 存 块 的 高 效 管 理 。 当 arena 中 有 不 
能 分 配 的 超大 内 存 时 ， 再 直接 使 用 mmap 从 系统 内 存 中 申请 ， 并 使 用 红 
黑 树 进 行 管 理 。 

即使 扒 分 配 算法 再 好 ， 也 只 是 解雇 了 扒 内 存 合理 分 配 和 回收 的 问 
题 ， 其 访问 性 能 远 不 如 栈 内 存 。 存 放 在 堆 上 的 数据 要 通过 其 存放 于 栈 上 
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的 数据 最 好 不 要 放 到 堆 上 。 因 此 ，Rust 的 类 型 默认 都 是 放 到 栈 上 的 。 


4.1.3 内 存 布 局 


内 存 中 数据 的 排列 方式 称 为 内 存 布 局 。 不 同 的 排列 方式 ， 占 用 的 
内 存 不 同 ， 也 会 间接 影响 CPU 访问 内 存 的 效率 。 为 了 权衡 空间 占用 情况 
和 访问 效率 ， 引 入 了 内 存 对 齐 规则 。 

CPU 在 单位 时 间 内 能 处 理 的 一 组 二 进 制 数 称 为 字 ， 这 组 二 进 制 数 
的 位 数 称 为 字 长 ”。 如 果 是 32 位 CPU， 其 字 长 为 32 位 ， 也 就 是 4 个 字 节 。 
一 般 来 说 ， 字 长 越 大 ， 计 算 机 处 理 信息 的 速度 就 越 快 ， 例 如 ，64 位 CPU 
就 比 32 位 CPU 效率 更 高 。 

以 32 位 CPU 为 例 ，CPU 每 次 只 能 从 内 存 中 读 取 4 个 字 节 的 数据 ， 所 
以 每 次 只 能 对 4 的 倍数 的 地 址 进行 读 取 。 

假设 现 有 一 整数 类 型 的 数据 ， 首 地 址 并 不 是 4 的 倍数 ， 不 妨 设 为 
0x3， 则 该 类 型 存储 在 地 址 范围 是 Ox3~Ox7 的 存储 空间 中 。 因 此 ，CPU 
如 果 想 读 取 该 数据 ， 则 需要 分 别 在 0x1 和 0x5 处 进行 两 次 读 取 ， 而 且 还 
需要 对 证 取 到 的 数据 进行 处 理 才 能 得 到 该 整数 ， 如 图 4-6 所 示 。CPU 的 
处 理 速 度 比 从 内 存 中 旋 取 数据 的 速度 要 快 得 多 ， 因 此 减少 CPU 对 内 存 
空间 的 访问 是 提高 程序 性 能 的 关键。 
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图 4-6: CPU 读 取 首 地 址 非 4 的 倍数 的 数据 
因此 ， 采 取 内 存 对 齐 案 略 是 提高 程序 性 能 的 关键 。 对 于 独 4-6 中 展 


示 的 整数 类型 ， 因 为 是 32 位 CPU， 上 所 以 只 需要 按 4 字 节 对 齐 ， 如 网 4-7 所 
IR, CPU R REIRA — K. 
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图 4-7: CPU 读 取 内 存 对 齐 数据 

因为 对 齐 的 是 字 节 ， 所 以 内 存 对 齐 也 叫 字 节 对 齐 ”。 内 存 对 齐 是 编 
详 需 或 虚拟 机 《比如 JVM) 的 工作 ， 不 需要 人 为 指定 ， 但 是 作为 开发 者 
需要 了 解 内 存 对 齐 的 规则 ， 这 有 助 于 编写 出 合理 利用 内 存 的 高 性 能 程 
序 。 

内 存 对 齐 包 括 基本 数据 对 齐 和 结构 体 〈 或 联合 体 ) 数据 对 齐 。 对 于 
基本 数据 类 型 ， 默 认 对 齐 方式 是 按 其 大 小 进行 对 齐 ， 世 被 称 作 目 然 对 齐 
。 比 如 Rust 中 u32 类 型 占 4 字 节 ， 则 它 默 认 对 齐 方 式 为 4 字 节 对 齐 。 对 于 
内 部 含有 多 个 基本 类 型 的 结构 体 来 说 ， 对 齐 规则 和 棚 微 有 点 复 休 。 

假设 对 齐 字 节 数 为 N (N =1, 2, 4, 8, 16) ， 每 个 成 员 内 存 长 度 
为 Len，Max (Len) 为 最 大 成 员 内 存 长 度 。 如 果 没 有 外 部 明确 的 规 
定 ，N 默认 按 Max (Len) 对 齐 。 字 节 对 齐 规则 为 : 

:结构 体 的 起 始 地 址 能 够 被 Max (Len) 整除 。 

结构 体 中 每 个 成 员 相 对 于 结构 体 起 始 地 址 的 偏 移 量 ， 即 对 齐 值 ， 
应 该 是 Min (N, Len) 的 倍数 ， 夺 不 满足 对 齐 值 的 要 求 ， 编 译 占 会 在 成 
TAZ BSA a PE 

结构 体 的 总 长 度 应 该 是 Min (N, Max (Len) ) AYE, A 
足 总 长 度 要 求 ， 则 编译 需 会 在 为 最 后 一 个 成 员 分 配 空间 后 ， 在 其 后 面 填 
TA TEA 


下 面 用 代码 清单 4-2 中 展示 的 Rust 结 构 体 验证 此 规则 。 
代码 清单 4-2: 以 Rust 中 的 结构 体 为 例 验 证 结构 体 字 节 对 齐 规 则 


lye Btruct A f 

Zi a: us, 

a be Woe, 

4, ez ulG, 

= d 

6. fn main() { 

Ta println! ("{:?}", std::mem::size of::<A>()); // 8 
8. } 


代码 清单 4-2 中 的 std: : mem: : sizeof: : <A> O 图 数 可 以 计 
算 结构 体 A 的 内 存 占用 大 小 。 基 本 数据 类 型 u8 占 1 个 字 节 ，u32 占 4 个 字 
节 ，ul6 晤 2 个 字 节 。 结 构 体 A 的 内 存 对 齐 《〈 即 字 节 对 齐 ) 前 后 的 布局 对 
比如 图 4-8 所 示 。 


内 存 对齐 之 前 结构 体 A 的 布局 


I 7 


= b 


内 存 对 齐 之 后 结构 体 A 的 布局 
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图 4-8: 结构 体 A 的 内 存 对 齐 前 后 的 布局 对 比 
图 4-8 中 的 一 个 方块 代表 一 个 字 节 ， 注 意 一 个 字 节 是 8 个 比特 位 。 和 内 
存 对 齐 之 前 ， 结 构 体 A 占用 7 个 字 季 。 代 人 码 清 蛙 4-2 中 结构 体 A 没 有 明确 
指定 字 节 对 齐 值 ， 所 以 默认 按 其 最 长 成 员 的 值 来 对 章 ， 结 构 体 A 中 最 长 
的 成 员 是 b， 占 4 个 字 市 。 那 么 对 于 成 员 a 来 说 ， 它 的 对 齐 值 为 Min (4, 
1) ， 即 1， 所 以 a 需要 补 齐 一 个 字 市 的 空间 ， 如 图 4-8 中 虚线 x 框 所 示 ， 


那么 现在 a 的 大 小 是 2 个 字 节 。 成 员 b 已 经 是 对 齐 的 ， 成 员 c 是 结构 体 中 最 
后 一 位 成 员 ， 当 前 结构 体 A 的 总 长 度 为 a、b、c 之 和 ， 占 8 个 字 节 ， 正 好 
征 Min (4, 4) ， 也 吏 是 4 的 倍数 ， 所 以 成 员 c 不 需要 再 补 齐 。 而 结构 体 
A 实际 占用 也 是 8 个 字 节 。 
联合 体 (Union) 和 结构 体 不 同 的 地 方 在 于 ， 联 合体 中 的 所 有 成 员 
都 共享 一 段 内 存 ， 所 有 成 员 的 首 地 址 都 是 一 样 的 ， 但 为 了 能 够 容纳 所 有 
成 员 ， 束 必须 可 以 容纳 其 中 最 长 的 成 员 。 所 以 联合 体 以 最 长 成 员 为 对 齐 
数 。 代 码 清单 4-3 展 示 了 Rust 中 的 联合 体 字 节 对 齐 。 
代码 清单 4-3: Rust 中 联合 体 字 节 对 齐 
union U { 
Tle WSZy 
TAs 532; 
f3: fod 
} 
fn main() 4 
println! ("{e?}", stadiem: size ofe:<uU>())e // 8 
} 


在 代码 清单 4-3 中 ，f1 和 f2 各 占 4 个 字 节 ，f3 占 8 个 字 节 ， 其 中 f3 最 
长 ， 所 以 联合 体 U 占 8 个 字 节 。f1、f2 和 f3 共 用 内 存 ，8 个 字 节 够 用 了 。 
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采用 虚拟 内 存 空 间 在 栈 和 推 上 分 配 内 存 ， 这 是 诺 多 编程 语言 通用 的 
内 存 管理 基石 ，Rust 当 然 也 不 例外 。 然 而 ， 与 C/C++ 语言 不同 的 是 ， 
Rust 不 需要 开发 者 显 式 地 通过 malloc/new 或 free/delete 之 类 的 函数 去 分 配 
和 回收 扒 内 存 。Rust 可 以 静态 地 在 编 详 时 确定 何 时 需要 释放 内 存 ， 而 不 
需要 在 运行 时 去 确定 。Rust 有 一 伍 完 整 的 内 存 管 理 机 制 来 保证 资源 的 合 
理 利 用 和 民 好 的 性 能 。 


4.2.1 变量 和 本数 


HARA, AeA: 全 局 变量 和 局 部 变量 。 全 局 变量 分 为 
TERE 和 前 态 变量 。 局 部 变量 是 指 在 函数 中 定义 的 变量 。 

向量 使 用 const 关键 字 定 义 ， 并 且 圾 要 显 式 指明 类 型 ， 只 能 进行 倍 
单 赋值 ， 只 能 使 用 文 持 CTFE 的 表达 却 。 和 背 量 没有 固定 的 内 人 存 地 址 ， 
AAA Ee ai, BEATER LMA, Ff Ace ean vias A Riche 
内 联 到 每 个 使 用 到 它 的 地 方 。 

静态 变量 使 用 static KEFEN, IRE EIF m wN a HRA, 
BEITHE, TM AN aE HERIZ. SREE m HEE 
的 ， 但 它 并 不 会 家 内 耿 ， 每 个 静态 变量 都 有 一 个 固定 的 内 存 地 址 。 

前 仿 变 量 并 非 被 分 配 到 栈 中 ， 也 不 是 在 堆 中 ， 而 是 和 程序 代 公 一 起 
航 存 储 于 裔 态 存 储 区 ”中 。 裔 态 存 储 区 是 伴随 独 程 序 的 二 进 制 文件 的 生 
成 ‘编译 时 ) 被 分 配 的 ， 并 且 在 程序 的 整个 运行 期 部 会 存在 。Rust 中 的 
字符 则 字面 量 同样 是 存储 于 静态 内 存 中 的 。 

习 测 是 合 声 明 未 初始 化 变量 

在 疯 数 中 定义 的 局 部 变量 部 会 被 默认 和 存储 到 栈 中 ”。 这 和 C/C++ 语 
言 ， 其 至 更 多 的 语言 行为 都 一 样 ， 但 不 同 的 是 ，Rust 编 诺 豆 可 以 检查 未 
倪 妈 化 的 变量 ， 以 保证 内 和 存 安 全 ， 如 代码 清单 4-4 所 示 。 

代码 清单 4-4: 检查 未 初始 化 变量 


1 fn main() { 

Z let x: 232; 

EF Prantin? (477. gers 
4 } 


代码 清单 4-4 纺 详 会 报 如 下 错误 : 


二 
pe {" i f "e 


Rusti FE As a ATARI ER BAS OP SCTE AT o ARIYA 4-4 H 
X 在 整个 main 函 数 中 并 没有 绑 定 任何 值 ， 这 样 的 代码 会 引起 很 多 内 存 不 
安全 的 问题 ， 比 如 计算 结果 非 预 期 、 程 序 朋 瀑 等 ， 所 以 Rust 编 译 器 必须 
报错 。 

Kor Ml a} SC it RE re Ta PE AR A) OR EE 

Rusti HAS WY BAS OP SC ED OT LOR TR 4-52 Sift 
促 中 初始 化 变量 的 情况 。 

代码 清单 4-5: 证 语句 中 初始 化 变量 
fn main() { 

let xz 132: 

if true { 

x = 1; 


} else { 


} 
光 守 下 
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CEASA AB4-5 PF, IOWA ENRERE ee x Sh re Se. AE 
可 以 正确 运行 。 但 是 如 果 去 掉 else 分 支 ， 编 译 器 就 会 报 以 下 错误 : 
error: use of possibly uninitialized variable: xX 
prinkial {p zis 


X Di A Sit Peas Ze Ee EX IPA IES A REA AR A 
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之 外 的 printtn! 也 用 到 了 变量 x， 但 并 未 有 任何 值 绑 定 行为 。 第 2 章 提 到 
过 ， 编 详 堪 的 静态 分 文 流程 分 析 并 不 能 识别 诗 表达 陈 中 的 条 件 是 true， 上 所 
以 它 要 检查 所 有 的 分 文 情 况 。 

如 果 把 代码 清单 4-5 中 else 分 文 和 第 8 行 的 printn! 语句 都 去 控 ， 则 可 
以 下 党 编译 运行 。 因 为 在 if 表 达 式 之 外 再 没有 使 用 到 x 的 地 方 ， 在 唯一 使 
用 到 x 的 让 表达 式 中 己 经 绑 定 了 仁 ， 所 以 编 详 正 常 。 

检测 循环 中 是 否 产 生 末 初始 化 变量 

还 有 为 外 一 种 情况 值得 考虑 ， 当 在 循环 中 使 用 break 关键 字 的 时 候 

(如 代码 清单 4-6 所 示 ) ，break 会 将 分 支 中 的 变量 值 返回 。 
代码 清单 4-6: 在 loop 循 环 中 使 用 break 关 键 字 


ng fn main() { 
Zs lek St 232) 
a leop { 
4. Lf true { 
Jy xX = 2; 
6 . break; 
Ta } 
on } 
9 . i 
| } 


MA Rustin VE As WY BAS OP CU Re PT AY LARGE, breaka Kx HE 
回 ， 所 以 在 loop 循 环 之 外 的 printn! 语句 可 以 正常 打印 x 的 值 。 
容 数 组 或 回 量 可 以 初始 化 变量 
当 变 量 绑 定 空 的 数组 或 回 量 时 (如 代码 清单 4-7 所 示 ) ， 需 要 显 式 
fae RY, APS PEAS CIE TE it RG 。 
代码 清单 4-7: Bb RE T BC 28 BY [a] E 
v AEN fn main() { 
2 let a: Vec<i32> = vec! []; 
SP let b: [1327 WI = []; 
4. } 


如 果 不 加 显 式 类 型 标注 ， 编 译 器 会 报 如 下 错误 : 
error [E0282]: type annotations needed 
TAH a] ee FY DA OR aa oes, E H I OA Pa tt E 
转移 所 有 权 产 生 了 未 初始 化 变量 
当 将 一 个 已 初始 化 的 变量 y 绑 定 给 万 外 一 个 变量 yY2 时 《如 代 但 清单 
4-8 所 示 ) ，Rnust 会 把 变量 y 看 作 进 辑 上 的 未 初始 化 变量 。 
代码 清单 4-8: 将 已 初始 化 变量 绑 定 给 另外 一 个 变量 


1 fn main() { 

2 let x = 42; 

3 let y = Box: :new()5); 

4. prinklni(™{ spi", ye Ay OxvEsrro4leqos 
3 let x2 = x; 

6 let y2 = y; 

7 ff printilat ("4 sor“, vir 


8. } 

在 代码 清单 4-8 中 ， 变 量 x 为 原生 整数 类 型 ， 默 认 存 储 在 栈 上 。 变 量 
y 属 于 指针 类 型 ， 通 过 Box: : new 方 法 在 堆 上 分 配 的 内 存 返 回 指针 ， 并 
与 y 绑 定 ， 而 指针 y 被 存储 于 栈 上 ， 可 以 通过 第 4 行 printn! 语句 打印 指针 
地 址 验证 这 一 点 ， 代 码 清 单 4-8 中 的 main 函 数 的 变量 内 存 布局 如 图 4-9 所 
外。 





图 4-9: main 函数 中 变量 内 存 布 局 示意 图 
第 5 行 代码 让 变量 x2 绑 定 了 变量 x， 因 为 x 是 原生 整数 类 型 ， 实 现 了 


Copy trait， 所 以 这 里 变量 x 并 未 发 生 任 何 变 化 。 但 是 在 第 6 行 代码 中 ， 变 
量 y2 绑 定 了 变量 y， 因 为 y 是 Box<T> 指 针 ， 并 未 实现 Copy trait, ATL 
此 时 y 的 值 会 移动 给 y2， 而 变量 y 会 个 编译 右 看 作 一 个 未 初始 化 的 变量 ， 
所 以 当 第 7 行 代码 再 次 使 用 变量 y 时 ， 编 译 占 就 会 报错 。 但 是 此 时 如 果 给 
y 岩 章 狐 绑 定 一 个 狐 值 ，y 依 然 可 用 ， 这 个 过 程 称 为 重新 初始 化 。 

当 main 函 数 调用 完毕 时 ， 栈 帆 会 极 释 放 ， 变 量 x 和 y 也 会 被 清空 。 变 
量 X 为 原生 类型 ， 本 残存 储 在 栈 上 ， 上 所 以 被 释放 是 没关系 的 。 但 是 变量 y 
是 指针 ， 如 果 束 这 样 被 清空 ， 那 么 其 指 同 的 已 分 配 堆 内 和 存 和 起 么 办 ? EG 
清单 4-8 中 并 没有 使 用 free 之 类 的 函数 去 清空 堆 内 和 存 ， 这 会 引起 内 和 丰 泄 汤 
的 问题 吗 ? 答案 是 不 会 ， 因 为 Box 三 TT 二 类 型 的 指针 会 在 变量 y 被 清空 
之 时 ,日 动 消 空 其 指 问 的 已 分 配 堆 内 存 。 

像 Box 二 TIT 二 这 梯 的 指针 人 被 称 为 贸 能 指针 。 使 用 智能 指针 ， 可 以 让 
Rust 利 用 栈 来 隐 式 目 动 释放 堆 内 存 ， 从 而 避免 显 式 调用 free 之 类 的 函数 
去 释放 内 存 。 这 样 其 实 更 加 符合 开 及 者 的 直觉 。 


4.2.2 智能 指针 与 RAII 


Rust 中 的 指针 大 致 可 以 分 为 三 种 : 引用 、 原 生 指 针 (CARED) 和 
智能 指针 o 

引用 项 是 Rust 提 供 的 普通 指针 ， 用 & 和 &mnut 操 作 符 来 创建 ， 形 如 
&T 和 &mut T。 原 生 指 针 是 指 形 如 *const T 和 *mut 这样 的 类 型 。 

引用 和 原生 指针 类 型 之 间 有 的 异同 如 下 。 

- 可 以 通过 as 操 作 符 随意 转换 ， 例 如 &T as*const T 和 &mut T as*mut 
T. 

. 原生 指针 可 以 在 unsafe 块 下 任意 使 用 ， 不 受 Rust 的 安全 检查 规则 
的 限制 ， 而 引用 则 必须 党 到 编译 硕 安 全 检查 规则 的 限制 。 

智能 指针 

智能 指针 (smart pointer) 实际 上 是 一 种 结构 体 ， 只 不 过 它 的 行为 
类 似 指 针 。 智 能 指针 是 对 指针 的 一 层 封 奖 ， 提 供 了 一 些 和 额外 有 的 功能 ， 比 
如 目 动 释放 堆 内 和 存 。 吞 能 指针 区 别 于 常规 结构 体 的 特性 在 于 ， 它 实现 了 
Deref 和 Drop 这 两 个 trait。Deref 提 供 了 解 引 用 能 力 ，Drop 提 供 了 目 动 析 
构 的 能 力 ， 正 是 这 两 个 trait 让 入 能 指针 拥有 了 类 似 指 针 有 的 行为 。 类 型 决 


定 行 为 ， 同 时 类 型 也 取决 于 行为 ， 不 是 指针 胜似 指针 ， 所 以 称 其 为 六 能 
针 。 开 发 者 也 可 以 编写 目 己 的 智能 指针 。 

第 3 章 已 经 看 章 介 绍 过 Deref， 用 它 可 以 重 载 解 引 用 运算 付 *x* -o ARE 
自 针 结构 体 中 实现 了 Deref， 重 载 了 解 引用 运算 符 的 行为 。 其 实 String 和 
Vec 类 型 也 是 一 种 智能 指针 《如 代码 清单 4-9 所 示 〉 ， 它 们 也 都 实现 了 
Deref 和 Drop。 

代码 清单 4-9: String 和 Vec 类 型 也 是 一 种 智能 指针 


i fn main() { 

ae ilet s = Strang: sirom(*hello"™) s 
3 // let deref s : str = *s; 

4. let v = vec! [1,2,3]; 

Bi. // let deref v: [u32] = *v; 

Bis } 


String 类 型 和 Vec KE ATE Al ce We OP BC SUE A SP ISAT AY, 3H 
过 将 返回 的 指针 封装 来 实现 Deref 和 Drop， 以 自动 化 管理 解 引 用 和 释放 
堆 内 存 。 代 码 清 日 4-9 中 第 3 行 代码 对 变量 s 进 行 了 解 引用 操作 ， 其 返回 
的 是 str 类 型 ， 因 为 str 是 大 小 不 确定 的 类 型 ， 所 以 编译 鼎 会 报错 ， 这 里 将 
其 注释 挥 了 ，String 类 型 和 Vec 类 型 虽然 是 智能 指针 的 一 种 ， 但 并 不 是 
让 开发 者 把 它们 当 作 指针 来 使 用 的 。 这 里 只 是 为 了 演示 说 明 ， 真 实 代 但 
中 并 不 会 这 样 用 。 同 理 ， 第 5 行 代码 对 变量 v 解 引用 ， 返 回 的 是 [u32] 类 
型 ， 依 然 是 大 小 不 人 确定 的 类 型 ， 所 以 这 里 也 将 其 注释 挥 了 。 

当 main 国 数 执行 完毕 ， 栈 帧 释放 ， 变 量 s 和 vV 被 清空 之 后 ， 其 对 应 的 
已 分 配 堆 内 存 会 被 目 动 释放 。 这 是 因为 它们 实现 了 Drop。 

Drop 对 于 智能 指针 来 说 非常 乍 要 ， 因 为 它 可 以 帮助 智能 指针 在 被 于 
工时 目 动 执行 一 些 重要 的 清理 工作 ， 比 如 释放 堆 内 存 ”。 更 重要 的 是 ， 
除了 释放 内 存 ，Drop 还 可 以 做 很 多 其 他 的 工作 ， 比 如 释放 文件 和 网 络 连 
接 。Drop 的 功能 有 点 类 似 GC， 但 它 比 GC 的 应 用 更 加 广泛 ，GC 只 能 回 
收 内 存 ， 而 Drop 可 以 回收 内 存 及 内 存 之 外 的 一 切 资源 。 

Ff RE VET HY 

其 实 这 种 资源 管理 的 方式 有 一 个 术语 ， 叫 RAII (Resource 
Acquisition Is Initialization ) ， 意 思 是 资源 获取 及 初始 化 。RAII 和 智能 


自 针 均 起 源 于 现代 C++， 智 能 指针 束 是 基于 RAII 机 制 来 实现 的 。 

在 现代 C++ 中 ，RAII 的 机 制 是 使 用 构造 函数 来 礼 始 化 资源 ， 使 用 术 
构 函 数 来 回收 资源 。 看 上 去 RAI 所 要 做 的 事 确实 跟 GC 差 不 多 。 但 RAII 
和 GC 最 大 的 不 同 在 于 ，RAII 将 资源 托管 给 创建 堆 内 存 的 指针 对 象 AN 
来 管理 ， 并 保证 资源 在 其 生命 周期 内 始终 有 效 ， 一 旦 生命 周期 终止 ， 资 
源 马 上 会 被 回收 。 而 GC 是 由 第 三 方 只 针对 内 存 来 统一 回收 垃圾 的 ， 这 
样 束 很 被 动 。 正 古 因 为 RAII 的 这 些 优势 ，Rust 也 将 其 纳入 了 目 己 的 体系 
中 。 

Rust 中 并 没有 现代 C++ 所 拥有 的 那 种 构造 图 数 〈constructor) ， 而 是 
直接 对 每 个 成 员 的 初始 化 来 完成 构造 ， 也 可 以 直接 通过 封装 一 个 静态 函 
数 来 构造 “构造 亢 数 ”。 而 Rust 中 的 Drop 丈 是 析 构 函数 (Destructor) 。 
”Drop 被 定义 于 std; : ops 和 模块 中 ， 其 内 部 实现 如 代码 清单 4-10 所 
7B 

代码 清单 4-10: Drop 的 内 部 实现 


7 #[lang = *drop |] 

2x PWD trale Drop | 

3 fn drop(&mut self); 
4. } 


从 代码 清单 4-10 可 以 看 出 来 ，Drop 已 经 被 标记 为 语言 项 ， 这 表明 该 
trait 为 语言 本 吴 所 用 ， 比 如 智能 指针 被 丢弃 后 目 动 触 友 析 构 图 数 时 ， 编 
详 荷 知道 该 去 哪里 找 Drop。 

代码 清单 4-11 通 过 为 结构 体 实现 Drop 来 展示 其 特性 。 

代码 清单 4-11: 为 结构 体 实现 Drop 


use sta: rops: Drop; 
# [derive (Debug) ] 
strut S 1132) 3 
impl Drop for 5 { 
fn drop(&mut self) { 
prineri drop ii", li 


} 


me O Oat oO & Ww hw Pa 


En marmi 4 

U a let x = 5(1)ż 
ilhs ME PEIN! I CTrare Xi tery, SF 
Le { 
Loy let y = S(2); 
14. pt tl (erate y: i7)"; vhs 
iag println! ("exit inner scope"); 
16. } 
Ly printin! ("exit main”) ; 
Ls, } 


代码 清单 4-11 中 定义 了 元 组 结构 体 S， 通 过 impl 为 结构 体 S 实 现 了 
Drop 定 义 的 drop 方 法 ， 令 其 在 被 调用 的 时 候 执 行 指定 的 打印 输出 。main 
函数 中 声明 了 两 个 结构 体 实例 x 和 y，y 被 置 于 内 部 scope 中 。 

代码 请 单 4-11 的 和 输出 结 末 如 代码 清单 4-12 所 示 。 

代码 清单 4-12: 为 结构 体 实现 Drop 的 输出 结果 

erate Xr S5(1) 
crate y: S(2) 
exit inner scope 
drop 2 

exit main 


Hron l 


FENG 4-11, Ex EHR Bl ze 4 Pmain es 2, my 
的 作用 域 范 围 是 内 部 scope 所 界定 的 范围 。 通 过 输出 结 朱 来 看 ， 在 变量 x 
和 y 分 别离 开 其 作用 域 时 ， 都 执行 了 drop 方 法 。 所 以 RAI 也 有 万 外 一 个 


别名 ， 叫 作用 域 界 定 的 资源 管理 CScope-Bound Resource Management 
，SBRM ) . 

这 也 正 是 Drop 的 特性 ， 它 允许 在 对 象 即将 消亡 之 时 ， 上 自行 调用 指 
EARNS (drop 方 法 ) 

Rust 中 的 一 些 党 用 类 型 ， 比 如 Vec、String 和 File 等 ， 均 实现 了 
Drop， 所 以 不 官 是 开发 者 使 用 Vec 创 建 的 动态 数组 被 丢弃 时 ， 还 是 使 用 
String 类 型 创建 的 字符 串 补 丢人 莽 时 ， 部 不 需要 显 式 地 释放 堆 内 存 ， 也 不 
需要 使 用 File 进 行文 件 谈 取 ， 甚 至 不 需要 显 陈 地 天 闭 文件 ， 因 为 Rust 会 
目 动 完成 这 些 操作 。 

使 用 Valgrind 来 检测 内 存 泄漏 

代码 清单 4-13 使 用 了 了 Box 二 T 二 指针 来 分 配 堆 内 和 存 ， 并 配合 一 于 知 名 
的 专门 用 于 内 存 调试 和 检测 内 存 兴 汤 的 工 上 其 Valgrind 来 验证 其 是 否 有 内 
TF THE o 

代码 清单 4-13: 使 用 Box 二 TT 二 指针 分 配 内 存 


le Tü greate Dexty 4 

Z let box3 = Box: :new(3); 
Sa j} 

4. fnmain() 1 

sT let boxl = Box::new(l1); 
6. { 

Ta let box2 = Box::new(2); 
8. } 

9， for Am Vxl OOO 1 

LM. create DOx () 5 

i } 

Las f 


将 代码 清单 4-13 保 存 到 box.rs 文 件 中 ， 使 用 rustc 命 令 将 其 编译 为 二 
进 制 文件 box: 


< FUSER bos. FE 


然后 再 执行 如 下 命令 : 


S$ valgrind ./box 
输出 结果 为 : 


==10323== Memcheck, a memory error detector 
==10323== All heap blocks were freed -- no leaks are possible 


==10323== ERROR SUMMARY: 0 errors from 0 contexts (Suppressed: 0 from 0) 


Valgrind 给 出 了 提示 : 所 有 扒 内 存 者 已 释放 。 证 明了 Box< 工 > 指针 
BE a Me WEB SM AA SEI, Ava Sree eR, PRIS HEA 

drop-flag 

在 代码 清单 4-13 中 ， 变 量 box1 和 box3 的 析 构 图 数 分 别 是 在 离开 main 
国 数 和 create_box 函 数 之 后 调用 的 。 而 变量 box2 EAF HEMSE 
的 显 式 内 部 作用 域 时 调用 的 。 它 们 的 析 构 函数 调用 顺序 是 在 编 详 期 (而 
非 运 行 时 )〉 束 确定 好 的 。 这 是 因为 Rust 编 详 间 使 用 了 名 为 drop-flag 
的 “魔法 ?>， 在 函数 调用 栈 中 为 离开 作用 域 的 变量 目 动 插入 布尔 标记 ， 标 
注 是 合 调 用 析 构 函数 ， 这 样 ， 在 运行 时 束 可 以 根据 编译 期 做 的 标记 来 调 
用 术 构 函数 了 。 

对 于 结构 体 或 枚 举 体 这 种 复合 类 型 来 襄 ， 并 不 存在 隐 式 的 drop- 
flag。 只 有 在 函数 调用 时 ， 这 些 复合 结构 实例 被 切 始 化 之 后 ， 编 译 占 才 
会 加 上 drop-flag。 如 果 复 合 结构 本 里 实 现 了 Drop， 则 会 调用 它 目 己 的 析 
构 函 数 ; FGM, eye FA ae oy HT Ay K BY 

SARE aE ZS Ab Sais, ERA BOY, thee ey _Edrop- 
flag， 在 运行 时 会 调用 析 构 函数 。 加 上 drop-flag 的 变量 意味 着 其 生命 周 
期 的 结束 ， 之 后 再 也 不 能 被 访问 。 这 其 实 束 是 第 5 章 会 讲 到 的 所 有 权 机 
制 | 。 

这 意味 看 ， 可 以 使 用 花 括 号 构造 显 式 作用 域 来 “主动 析 构 ?那些 需要 
提前 结束 生命 周期 的 变量 ， 如 代码 清单 4-14 所 未 。 

代码 清单 4-14: 使 用 花 括号 构造 显 式 作用 域 主动 析 构 局 部 变量 


fn maint) { 
let mut v = vec! [1, 2, 3]; 


{ 


} 7 
// wv.push(4); 


a oF i a w@ Nw H 
< 
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部 作用 域外 使 用 push 方 法 ， 则 会 报错 ， 因 为 变量 v 已 经 被 释放 了 。 

值得 注意 的 是 ， 对 于 实现 Copy 的 类 型 ， 是 没有 析 构 函数 的 。 因 为 实 
现 了 Copy 的 类 型 会 复制 ， 其 生命 周期 不 受 术 构 函 数 的 有 影响， 所 以 也 束 没 
必要 存在 析 构 水 数 。 

JENS, Aerie (shadowing ) 并 不 会 导致 其 生命 周期 提前 结束 ， 
如 代码 清单 4-15 所 示 。 

代码 清单 4-15: 芝 量 遮 向 不 等 于 生命 周期 提前 结束 


由 ”巧合 

2. #[derive (Debug) ] 

Ba gruet S162) ) 

4, MMOL Drop Tor S i 

sE EnA crop (Smut Self) 4 

P prantlal) "drop wer 7", sel) 
hy } 

Ss } 

J. ER MAINO | 

LO let x = S{1); 

ia princini("ereate a: Lith", R)? 

LZ: let g = B82). 

ie println! ("“ereate shadowing xi {27)}", &); 
14. } 


PSs 4-15 Fa EARR, BU HRC AN 2 ET Ad JOR EY BB 
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4.2.3 A fein SARE 


RAII 的 设计 目标 束 是 蔡 代 GC， 防 止 内 存 汇 漏 。 然 而 RAII 并 非 “ 银 
弹 ”， 如 果 使 用 不 当 ， 还 是 会 造成 内 存 泄漏 的 。 

制造 内 存 泄 漏 

有 的 时 候 ， 需 要 对 同一 个 堆 内 存 块 进行 多 次 引用 。 比 如 ， 要 创建 一 
个 链表 ， 如 图 4-10 所 示 。 








图 4-10: 创建 链表 示意 图 
那么 ， 首 先 需 要 创建 一 个 节点 Node 结 构 体 ， 如 代码 清单 4-16 所 示 。 
代码 清单 4-16: 链表 节点 Node 结 构 体 


i struct Node<T> 1 


ET gata: Ty 
3. next: NodePtr<T>, 
4. } 
仔细 思考 ， 此 处 NodePtr< 工 > 该 如 何 设计 呢 ? BT EAA BAR 
jH: 
type NodePtr<T> = Option<Box<Node<T>>> 
nodel.next = node2 
node2.next = node3 


这 里 的 NodePtr< 工 > 首先 是 一 个 Option<T >， 因 为 链表 的 结尾 节 
点 之 后 有 可 能 不 存在 下 一 个 和 节点， 所 以 需要 Some<T>> 和 None。 然 
后 ， 还 需要 一 个 乔 能 指针 来 保持 市 态 之 间 的 连接 ， 所 以 此 处 设想 


NodePtr<T > -AOpiton<Box<Node<T>>>. 


然后 了 加 是 对 nodel.next 和 node2.next 赋 全 ， 使 得 nodel1、node2 和 mode3 
节点 相连 ， 束 像 图 4-10 展 示 的 那样 。 但 是 这 里 有 个 问题 ， 因 为 Box 二 TT 
指针 对 所 管理 的 推 内存 有 唯一 拥有 权 ， 所 以 并 不 共享 。 人 代码 清单 4-17 展 
示 了 如 何 使 用 Box< 工 > 来 构造 链表 节点 之 间 的 指针 。 

代码 清单 4-17: 使 用 Box 天 工 > 来 构造 链表 节点 之 间 的 指针 
type NodePtr<T> = Option<Box<Node<T>>>; 
struct Node<T> { 
data: T, 
next: NodePtr<T>, 


il 

2 

3 

4 

a + 
6 fn main() { 

7 let mut first = Box::new (Node { data: 1, next : None }); 
8 let mut second = Box::new (Node { data: 2, next : None }); 
9 first.next = Some (second); 


Mee second.next = Some (first); 


代码 清单 4-17 编 译 会 报 如 下 错误 : 
error[E0382]: use of moved value: ‘second’ 


first.next = Some (second); 


second.next = Some(first); 


RA KRARKAARAAKAAAKAAAAKAAAAKAAAAAKAAAAA 


| 
| ee ee value moved here 
| 
| 


value used here after move 


is 4-17 1) 9747 Ht second i mi fa xe 2a 了 first， 因 为 sencond 使 用 
了 了 Box 二 TI 过 指针 ， 此 时 second 发 生 了 值 移动 ， 变 成 了 未 初始 化 变量 ， 所 
以 在 第 10 行 使 用 它 的 时 候 ， 编 译 器 报错 了 。 

Rust 男 外 提供 了 智能 指针 Rc 二 TT ， 它 的 名 字 叫 引用 计数 
(reference counting ) 智能 指针 ， 使 用 它 可 以 共 于 同一 块 堆 内 和 存 。 可 
以 将 Box<T> 换 为 Re<T>, JK NodePtr<T>> 就 变 成 了 Option<Rc 
<Node <T> 之 >。 但 是 Re<T>> 有 一 个 特性 : 它 包 含 的 数据 TIT 是 不 可 变 
的 ， 而 second.next=Some (first) 这 种 操作 需要 是 可 变 的 ， 因 为 要 修改 


second 中 next 成 员 的 值 。 所 以 ， 仅 仅 使 用 Rc 和 工 > 还 不 够 ， 如 代码 请 单 4- 
18 所 示 。 


代码 清单 4-18: 仪 使 用 Rc 二 TT 二 的 情况 


is WE Stal src TR 

2. type NodePtr<T> = Option<Rc<Node<T>>>; 

3. struct Node<T> | 

4, data: T, 

ef next: NodePtr<T>, 

6. | 

de tm maini) 1 

8 let first = Rc::new(Node { data: 1, next: None}); 
9, let second = Rc::new(Node { data: 2, next: Some(first.clone()) }); 
Lis first.next = Some(second.clone()); 

ipa second.next = Some(first.clone()); 

Ls } 


在 代码 清单 4-18 中 ， 变 量 first 和 second 使 用 了 clone 方 法 ， 但 并 不 会 
真 的 复制 ，Rc<TI> 内 部 维护 着 一 个 引用 计数 器 ， 每 clone 一 次 ， 计 数 规 
加 1， 当 所 们 离开 main 冰 数 作用 域 时 ， 计 数 磺 会 锌 清和 去， 对 应 的 扒 内 存 
也 会 被 目 动 释放 。 

不 出 所 料 ， 人 代码 清单 4-18 编 详 会 报错 。 

error[E0594]: cannot assign to immutable field 
| first.next = Some (second); 


| AKRAKAAAAAAAAAKAAAAAAAAAAAAAKAA 


cannot mutably borrow immutable field 

编译 副 提 示 ， 不 能 对 不 可 变 字 上段 进行 修改 。 不 过 ，Rust 提供 了 另外 
一 个 留 能 指针 RefCell<T>， 它 提供 了 一 种 内 部 可 变性 ， 这 意味 看 ， 息 
对 编 详 右 来 说 是 不 可 变 的 ， 但 在 运行 过 程 中 ， 包 含 在 其 中 的 内 部 数据 是 
可 变 的 。 那 么 我 们 使 用 RefCell<T > 来 重 构 代 码 清单 4-18， 此 时 NodePtr 
<T> RA KH I Option<Rce<RefCell<Node<T>>>>, WRIA E 
4-19}IT AN o 


代码 清单 4-19: 使 用 RefCell 二 TT 保证 内 部 可 变 


Le Wee BEd: tree RG 

2. use std::cell::RefCell; 

3. type NodePtr<T> = Option<Rc<RefCell<Node<T>>>>; 
a. struct Node<T> { 

D data: T, 

6 4 next: NodePtr<T>, 

ks } 

8 ， fn main() { 

Ja let first = Rc::new(RefCell::new(Node { 

eG data: te 

i la I next: None, 

I2, by. 

13 let second = Rc: :new (RefCell: :new (Node { 

14. data: 2, 

Ls next: Some(first.clone()), 

15， }) ) 7 

Lad y first.borrow mut().next = Some(second.clone()); 
上 总， second.borrow mut().next = Some(first.clone()); 
Ly. J 


Main 4-19 终于 可 以 正常 运行 了 ， 但 是 代码 中 使 用 了 两 种 智能 
指针 ， Re<T> AllRefCell<T> ， 内 存 是 否 可 以 被 正确 释放 ? 现在 我 
们 为 Node 结 构 体 实现 Drop， 来 验证 内 存 是 否 可 以 被 正确 释放 ， 如 代码 
清单 4-20 所 示 。 

代码 清单 4-20: 为 Node 结 构 体 实现 Drop 


use std: tre: eRe; 
use std::cell::RefCell; 
type NodePtr<T> = Option<Rc<RefCell<Node<T>>>>; 
struct. NodexT> { 
darca?! "E; 
next: NodePtr<T>, 
} 
impl<T> Drop for Node<T> 1 
fn drop (smut self) 4 


om HOF B w M H 


TU; 人 工人 

et Y } 

LEs 

I3. Et marta 4 

14. let first = Rc::new(RefCell::new(Node { 

Let data: 1y 

TO. next: None, 

T tig 

Le p let second = Rc::new(RefCell::new(Node { 

193, data: 2, 

20 next: Some(first.clone()), 

21 JIE 

2: FREETOW MUC): Hex = some [BEcorna:GLOne] > 
p S6COnd, borrow Milt) -next = Some (TLrst-Clone()): 
24. } 


在 代 公 清早 4-20 中 ，Node 二 TIT 二 结构 体 实现 了 Drop， 其 析 构 函数 
drop 会 输出 指定 的 字符 串 。 第 22 行 和 第 23 行 中 出 现 了 一 个 循环 引用 ， 
first 和 second 广 点 互相 指 同 对 方 。 但 是 编 详 运行 之 后 并 没有 看 到 任何 输 
出 。 这 说 明 析 构 函 数 并 没有 执行 ， 这 里 存在 内 存 泄 漏 。 

这 是 一 次 精心 设计 的 内 存 汇 着， 只 是 为 了 证 明 一 件 事 : Rust 并 不 能 
百 分 百 地 阻止 内 存 泄 漏 ， 但 也 不 是 轻 而 匈 举 束 可 以 造成 内 存 兴 漏 的。 

内 存 安 全 的 含义 

Rust 个 是 号 称 内 存 安全 的 语言 吗 ? 为 什么 还 可 以 造成 内 存 泄漏 ? 这 
也 许 是 每 个 Rust HFA MAE. mE, Ariy (Memory Leak) 


并 不 在 内 存 安全 (Memory Safety) 概念 范围 内 。 

只 要 不 会 出 现 以 下 内 存 问题 即 为 内 存 安 全 : 

: 使 用 未 定义 内 存 。 

- 2548 ET 

-AEFT 

` Z X Yank HH o 

非法 释放 未 分 配 的 指针 或 已 经 释放 过 的 指针 。 

Rust 中 的 变量 必须 初始 化 以 后 才 可 使 用 ， 人 否则 无 法 通过 编译 需 检 
但。 所 以 ， 可 以 排除 第 一 种 情况 ，Rust 不 会 允许 开发 者 使 用 未 定义 内 
TF o 

Et ” 束 是 指 Java 中 的 nuall、C++ 中 的 nullptr 或 者 C 中 的 NULL 。 而 
在 Rust《〈 特 指 Safe Rust) 中 ， 开 发 者 没有 任何 办 法 去 创建 一 个 空 指针 ， 
因为 Rust 不 文 持 将 整数 转换 为 指针 ， 也 不 文 持 未 初始 化 变量 。 其 他 语言 
中 引入 空 指针 ， 是 因为 空 指针 可 以 在 逻辑 上 表示 个 指 问 任何 内 存 ， 比 如 
一 个 方法 返回 空 指 针 ， 表 示 其 返回 值 不 存在 ， 便 于 在 代码 中 进行 远 辑 判 
源 。 但 这 痢 是 人 为 控制 的 ， 如 末 开 发 者 并 没有 对 空 指 针 进 行 处 理 ， 束 会 
出 现 问 题 。Rust 中 使 用 Option 交 型 来 代 蔡 空 指 针 ，Option 实 际 是 枚 举 
体 ， 包 含 两 个 值 : Some (T) 和 None， 分 别 代 表 两 种 情况 ， 有 和 无 。 这 
残 迫 使 开 及 者 必须 对 这 两 种 情况 都 做 处 理 ， 以 保证 内 存 安 全 。 

ajat (dangling pointer ) 是 指 扒 内 存 已 被 释 放 ， 但 其 本 映 还 
BOA UE AEE, RIB Fa Te) CUBIC A ENTS. WSR ETS ET OTE 
FRH, WS HUIS SR, TAS 4-21 ak SE 
针 。 

代码 清单 4-21: 构造 惹 亚 指针 


Is En FOOS'A>() => D'a ste f 

2 let a = "hello. to string (|: 
3 &a 

4. } 

oe tn main() | 

P let x = foo(); 

Ts } 


Mis 4-217 X J fook, iI&’ a str 类 型 ， 其 中 a 为 生命 周 
期 标记 ， 在 第 5 章 会 着 重 介 绍 。&”a str 类 型 实际 是 标注 了 生命 周期 标记 
的 &str 闫 型。 该 亢 数 体 内 定义 了 局 部 变量 a， 并 返回 a 的 引用 。 但 是 局 部 
变量 a 在 离开 foo 函 数 之 后 会 被 销毁 。 如 果 把 该 引 用 传 到 函数 外 面 ， 绑 定 
给 main 函 数 中 的 变量 x， 则 会 出 现 问题 。foo 国 数 中 的 &a 融 是 一 个 惹 垂 指 
E 

7%, Rustin Pease Ne UE Sa 4-21 PAY, E FR 
PH: 

error[E0597]: ‘a’ does not live long enough 
| &a 
| “ does not live long enough 
EE. 

编译 器 提示 ， 变 量 a 的 生命 周期 很 短暂 一 就 这 样 简单 地 过 免 了 一 
次 基 重 指针 导致 的 内 存 安全 问题 。 这 背后 的 功臣 是 第 5 章 会 着 重 介绍 的 
Rust 的 所 有 权 和 信用 机 制 。 

组 可 区 是 指 一 块 连续 的 内 存 区 域 ， 可 你 和 存 相 同类 型 的 多 个 实例 。 绥 
冲 区 可 以 是 栈 内 存 ， 也 可 以 是 堆 内 和 存 。 一 般 可 以 使 用 数组 来 分 配 绥 冲 
区 。C 和 和 C++ 语言 没 有 数组 越界 检查 机 制 ， 当 癌 局 部 数组 缓冲 区 里 写 入 
的 数据 超过 为 其 分 配 的 大 小 时 ， 束 会 友 生 缓冲 区 癣 出。 攻击 者 可 利用 绥 
冲 区 溢出 来 窜改 进程 运行 时 栈 ， 从 而 改变 程序 正常 流向 ， 轻 则 导致 程序 
崩 演 ， 重 则 导致 系 统 特权 被 鳃 取 。 而 使 用 Rust 则 无 须 担心 这 种 问题 ， 
Rust 编 译 器 在 编译 期 就 能 检查 出 数组 越界 的 问题 ， 从 而 完美 地 避免 了 绥 
冲 区 溢出 。 在 第 3 章 和 第 4 章 中 都 已 经 举 了 不 少 相 关 示 例 。Rust 中 不 会 出 
现 未 分 配 的 指针 ， 所 以 也 不 存在 非法 释放 的 情况 。 同 时 ，Rust 的 所 有 权 
机 制 严 格 地 你 证 了 析 构 函数 只 会 调用 一 次 ， 所 以 也 不 会 出 现 非法 释放 已 
释放 内 存 的 情况 。 

忌 的 来 说 ，Rust 对 内 存 安 全 做 出 了 百分之百 的 你 证 。 但 是 这 并 不 总 
味 看 能 百分之百 地 阻止 内 存 泄 漏 ， 因 为 内 存 泄漏 是 无 法 避免 的 ， 哪 怕 古 
拥有 GC 的 语言 ， 也 照样 会 出 现 内 存 汇 漏 的 问题 。 

内 存 汇 漏 的 原因 

在 Rust 中 可 导致 内 存 洪 漏 的 情况 大 概 有 以 下 三 种 : 


Zhe AA Tot. Nr Re eR BTC IZ. Vid H o 

:使 用 引用 计数 时 造成 了 循环 引用 。 

.调用 Rust 标 准 库 中 的 forget 函 数 主 动 泄漏 。 

对 于 线程 朋 涡 ， 没 有 什么 好 的 办 读 来 阻止 它 ; 我 们 也 已 经 见识 过 循 
环 引 用 了 。 但 是 Rust 为 什么 会 提供 一 个 主动 泄漏 内 存 的 forget 函 数 呢 ? 

以 上 三 种 情况 从 本 质 上 说 束 是 ，Rust 并 不 会 保证 百分之百 调用 析 构 
函数 。 析 构 函 数 可 以 做 很 多 事情 ， 除 了 释放 内 存 ， 还 可 以 释放 其 他 资 
源 ， 如 末 析 构 函 数 不 能 执行 ， 不 仅仅 会 导致 内 存 汇 漏 ， 从 更 广 的 角度 来 
看 ， 还 会 导致 其 他 资源 泄漏 。 相 比 内 存 安 全 问题 ， 资 源 汽 漏 其 实 并 没有 
那么 严重 。 以 内 存 泄漏 为 例 ， 一 次 内 存 汇 漏 不 会 有 多 大 影响 ， 但 是 一 次 
内 存 不 安全 操作 可 能 会 导致 灾难 性 的 后 末 。 

内 存 涝 漏 是 指 疫 有 对 应 该 释放 的 内 存 进 行 释 放 ， 属 于 没有 对 合法 的 
数据 进行 操作 。 内 和 存 不 安全 操作 是 对 不 合法 的 数据 进行 了 操作 。 两 者 性 
质 不 同 ， 造 成 的 后 来 也 不 同 。 

甚至 有 时 候 还 需要 进行 主动 泄漏 。 比 如 ， 通 过 FFI 与 外 部 函数 打 交 
道 ， 把 值 交 由 C 人 代码 去 处 理 ， 在 Rust 这 边 要 使 用 forget 函 数 来 主动 泄漏 ， 
防止 Rust 调 用 析 构 函数 引起 问题 。 第 13 章 有 关于 forget 函 效 的 更 详细 的 


介绍 。 
4.2.4 复合 类 型 的 内 存 分 配 和 布局 


对 于 基本 原生 数据 类 型 来 说 ，Rust 是 默认 将 其 分 配 到 栈 中 的 。 那 
结构 体 (Enum) 或 联合 体 (Union) 是 被 分 配 在 哪 的 呢 ? 
结构 体 或 联合 体 只 是 定义 ， 看 它们 被 分 配 在 哪 ， 主 要 是 看 其 类 型 实 
例如 何 使 用 。 代 人 码 清 单 4-22 验 证 了 三 种 复合 结构 内 存 的 布局 。 

代码 清单 4-22: 验证 三 种 复合 结构 内 存 布局 


a 


Ne 


i struct A { 
Ea ah UFa 
3s b: Box<u64>, 
4. } 
Be SEMICE BiasZ, Ep4, ehar)? 
Gs Struct Ny 
Ty enum E { 
Bis HT 
Ox M(Box<u32>) 
ie) 3 
li, mion U { 
LZ: ü: W32, 
loy v: u64 


Lay } 
LS, Eh anoi 


16. printing I "Dom (tei, 

LT praincin: ("Az ¢37}", stds emen 
18. Print I ("Bs Arh, Boas eens 
L. priantini ("Ny A Sta: inen 
AY omen ("Es Yr?" sid. amen 
AR orineln: ("Uz 437k", Bias sme 


Lha | 


Le Ore} 
elas Dry: 
(Slee ort: 
(Size: Ors: 


SLRS OTT 


std: sMems {Size of: e<Boxcug2>> ()) 7 


Sis 4-22 78 itt 了 Rust 中 三 种 目 定 义 复合 数据 结构 :结构 体 、 枚 


举 体 和 联合 体 。 


结构 体 A 的 成 员 a 为 基本 数字 类 型 ，b 为 Box 二 T> 


关 型 。 


根据 内 存 对 


齐 规则 ， 结 构 体 A 的 大 小 为 16 个 字 市 ， 其 内 存 对 齐 示 意 如 图 4-11 所 示 。 


结构 体 A 


b: Box<u32> 





box 指针 





图 4-11: 结构 体 A 的 内 存 对 齐 示 意图 

在 图 4-11 中 ， 每 个 方块 代表 一 个 字 广 。 按 照 内 存 对 齐 规则 ， 结 构 体 
A 中 的 成 员 b 最 长 ， 占 8 个 字 季 ， 所 以 按 8 字 和 对 齐 ， 变 量 a 需 要 补 齐 4 个 字 
节 ， 整 个 结构 体 长 度 为 a 和 b 之 和 ， 占 16 个 字 节 。 

当 结 构 体 A 在 函数 中 有 实例 被 初始 化 时 ， 访 结构 体会 被 放 到 栈 中 ， 
首 地 址 为 第 一 个 成 员 杰 量 a 的 地 址 ， 长 度 为 16 个 字 节 。 其 中 成 员 b 是 Box 
<u32 之 关 型 ， 会 在 推 内 存 上 开放 空间 存放 数据 ， 但 是 其 指针 会 返回 给 
成 员 b， 并 存放 在 栈 中 ， 一 共 占 8 个 字 市 。 

在 代码 清单 4-22 中 ， 结 构 体 B 为 元 组 结构 体 ， 其 对 齐 规 则 和 普通 
结构 体 一 样 ， 所 以 占 16 个 字 市 。 

结构 体 N 为 单元 结构 体 ， 占 0 个 字 熙 。 

枚 举 体 E 实 际 上 是 一 种 标签 联合 体 〈Tagged Union) ， 和 普通 联合 
VS (Union) 的 共同 点 在 于 ， 其 成 员 变 量 也 共用 同一 块 内存， 所 以 联合 
体 也 人 锌 称 为 共用 体 。 不 同 点 在 于 ， 标 签 联合 体 中 每 个 成 员 都 有 一 个 标签 
(tag) ， 用 于 显 式 地 表明 同一 时 刻 哪 一 个 成 员 在 使 用 内 存 ， 而 且 标 俭 
也 需要 占用 内 存 。 操 作 枚 举 体 的 时 候 ， 需 要 匹配 处 理 其 所 有 成 员 ， 这 也 
是 其 被 称 为 枚 举 体 的 原因 ， 网 4-12 展 示 了 枚 举 体 E 内 存 对 齐 的 布局 。 


枚 举 体 下 


Box<U32> 





图 4-12: 枚 举 体 E 的 内 存 对 齐 示意 图 

在 枚 举 体 E 的 成 员 H(u32〉 AIM (Box<u32>) 中 ，H 和 M 就 是 标 
使 ， 占 1 个 字 和 有 有。 但 是 HE 和 M 都 市 有 目 定 义 数 据 ，u32 和 Box<u32 之 ， 其 
中 Box<u32 之 最 长 ， 按 联合 体 的 内 存 对 齐 规则 ， 此 处 按 8 字 节 对 齐 。 所 
以 ， 标 俭 需要 补 齐 到 8 个 字 世 ， 目 定义 数据 取 最 长 字 节 ， 即 8 个 字 节 ， 整 
个 枚 举 体 的 长 大 为 标签 和 上 自 定 义 数 据 之 和 ， 为 16 个 字 方 。 联 合体 U 没 有 
byte, TEATS, HBS EH. 

当 枚 举 体 和 联合 体 在 函数 中 有 实例 被 初始 化 时 ， 与 结构 体 一 样 ， 也 
会 航 分 配色 栈 中 ， 占 相应 的 字 蔬 长度。 如 末 成 员 的 值 存 放 于 扒 上 ， 那 么 
栈 中 就 存放 其 指针 。 

代码 清单 4-22 最 终 的 输出 结 末 如 代码 清单 4-23 所 示 。 

代码 清单 4423: 三 种 复合 结构 内 存 布局 的 输出 结果 

Box<u3sZz>¢ B 

A: 16 
B; 16 
N: O 
E: 16 
U: 8 


4.3 小 结 


本 章 首先 从 诸多 编程 语言 内 存 管理 机 制 出 发 ， 将 其 归 为 两 类 : 手动 
内 存 管理 类 和 目 动 管理 类 。 十 老 的 C 和 C++ 语言 采用 手动 内 存 管 理 机 
制 ， 随 着 GC 的 发 明 以 及 垃圾 回收 算法 的 不 断 完 善 ， 大 多 数 现代 高 级 编 
程 语言 采用 GC 进 行 目 动 化 管理 内 存 ， 但 是 它们 都 有 各 目的 优 缺 点 
手动 管理 容易 引起 诸多 安全 问题 ， 上 自动 管理 会 影响 性 能 。Rust 作 为 现代 
WARK a, BA SAMAR ES BOTA, TINGE S AE 
安全 和 性 能 。 

接 下 来 ， 我 们 回顾 了 关于 内 存 的 通用 概念 。 首 先是 一 条 通用 的 规 
则 :编程 语言 分 配 和 回收 内 存 都 是 基于 虚拟 内 存 进行 操作 的 ， 然 后 介绍 
了 栈 和 堆 的 异同 ， 还 介绍 了 数据 存储 时 的 内 存 布局 和 对 齐 规则 。 这 些 都 
是 理解 Rust 编 程 语 言 所 需 的 基础 。 

然后 我 们 深入 探索 了 Rnust 语 言 的 资源 管理 机 制 。Rust 没 有 使 用 GC， 
但 是 它 引 入 了 来 目 C++ 的 RAIH 资 源 管理 机 制 。 默 认 在 栈 上 分 配 ， 不 提供 
显 式 的 扒 分 配 函 数 ， 而 是 通过 智能 指针 Box<TI > 这 样 的 类 指针 结构 体 
来 自动 化 管理 扒 内 存 。 由 于 RAII 机 制 ， 使 用 智能 指针 在 堆 上 分 配 内 存 以 
后 ， 返 回 的 指针 被 绑 定 给 栈 上 的 变量 ， 在 函数 调用 完成 后 ， 栈 怖 被 销 
虹 ， 栈 上 变量 被 于 弄 ， 之 后 会 目 动 调用 析 构 函数 ， 回 收 资 源 。 

RAII 机 制 虽 然 可 以 防止 内 存 泄漏 ， 但 还 是 可 以 通过 精心 设计 来 制造 
内 存 泄漏 的 。 比 如 通过 Rc<T> 和 RefCell< 工 > 来 构造 循环 引用 ， 就 可 
以 制造 内 存 泄漏 。 但 实际 上 内 存 泄漏 并 不 在 Rust 所 百分之百 保证 的 内 存 
安全 的 概念 范畴 中 。Rust 保 证 不 出 现 空 指针 和 基 垂 指针 、 没 有 缓冲 区 洲 
出 、 不 能 访问 未 定义 内 存 以 及 不 能 非法 释放 不 合法 的 内 和 存 《 比 如 已 经 释 
放 的 内 存 和 未 定义 的 内 存 ) ， 当 然 这 一 切 的 前 提 是 不 要 乱用 unsafe 块 。 
Rust 并 不 保证 内 存 泄漏 不 会 发 生 ， 但 使 用 Rust 也 不 会 “轻而易举 ”地 造成 
内 存 泄漏 的 问题 。 

最 后 ， 本 章 通 过 一 个 示例 探索 了 目 定 义 复合 数据 结构 的 内 存 分 配 和 
布局 ， 进 一 步 回顾 并 验证 通用 概念 中 的 内 存 对 齐 规则 ， 以 帮助 读者 加 深 
理解 。 

通过 本 章 的 学 习 ， 和 希望 读者 可 以 对 Rust 中 的 内 存 管 理 机 制 建立 一 个 





完整 的 心 吞 模型 ， 通 过 阅读 Rust 代 人 码 就 可 以 明日 其 中 的 内 存 分 配 和 布 
局 ， 以 及 资源 宫 理 机 制 ， 为 第 5 草 的 所 有 权 机 制 的 学 习 丙 定 基础 。 





[1] 栈 和 堆 的 增长 方向 取决 于 操作 系统 和 CPU， 此 处 是 简化 的 32 位 Linux/x86 进 程 地 址 空间 模型 。 
[2] Bertrand Meyer 是 Eiffel 语言 和 按 契 约 设计 (Design by Contract) 思想 的 发 明 者 ，《 面 向 对 象 软件 构造 》 一 书 的 作 
Bo 
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律 者 ， 所 以 定 分 目 争 也 。 

《 慎 子 》 书 中 有 一 典故 : “一 免 走 衔 ， 百 人 仍 之 ， 分 未 定 也 ; 积 免 
满 市 ， 过 而 不 顾 ， 非 不 欲 金 ， 分 定 不 可 争 也 。”* 大 意 是 ， 一 只 兔子 在 大 
了 街 上 乱 跑 ， 看 到 的 人 都 想 据 为 己 有 ， 是 因为 这 只 钢 子 “名 分 未 定 ”， 而 到 
了 兔 市 ， 谁 也 不 能 随便 拿 ， 就 连 小 偷 也 不 敢 轻 易 下 手 ， 因 为 这 些 锡 
子 “ 名 分 已 定 ”"， 它 们 是 有 主人 的 。 这 就 意味 着 ， 只 有 确定 了 权利 归属 ， 
才能 防止 纠纷 的 发 生 。 通 过 法 律 划 分 出 明确 的 权 属 界限 ， 才 能 厘清 每 个 
人 的 行为 界限 ， 人 合理 保障 个 人 的 目 由 空间 、 利 益 范 围 和 生命 安全 。 

内 存 管 理 不 外 如 是 。 栈 内 存 的 生命 周期 是 短暂 的 ， 会 随 着 栈 展 开 
(常见 的 是 函数 调用 〉 的 过 程 而 被 自动 清理 。 而 堆 内 存 古 动态 的 ， 其 分 
配 和 重新 分 配 并 不 遵循 某 个 固定 的 模式 ， 所 以 需要 使 用 指针 来 对 其 进行 
跟踪 。Rust 受 现代 C++ 的 启发， 同样 引入 了 锦 能 指针 来 管理 推 内 存 。 御 
能 指针 在 堆 上 开辟 内 存 空间 ， 并 拥有 其 所 有 权 ， 通 过 存储 于 栈 中 的 指针 
来 管理 堆 内 存 。 智 能 指针 的 RAID 机 制 利 用 栈 的 特点 ， 在 栈 元 素 被 自动 
清空 时 上 自动 调用 析 构 函数 ， 来 释放 智能 指针 所 管理 的 推 内 存 空间 。 

现代 C++ 的 RAII 机 制 解决 了 无 GC 目 动 管 理 内 存 的 基本 问题 ， 但 并 
没有 解决 全 部 问题 ， 还 存在 着 很 多 安全 隐患 ， 代 码 清单 5-1 展 示 了 其 中 
= Te 

代码 清单 5-1: C++ 的 RAI 机 制 存在 的 安全 隐患 示例 


#include <iostream> 

#include <memory> 

using namespace std; 

int main () 

{ 
Unique: pCI Originen Int (2) YN 
HUE <= EL << endl; 


auto stolen = move(orig); 


Oo Oro mm B W N FF 


GOUT =< forig <= endl; 
} 


代码 清单 5-1 等 价 于 代码 清单 5-2 中 的 Rust 人 代码。 
代码 清单 5-2: 等 价 于 代码 清单 5-1 的 Rust 代 码 


1. fn main() { 


= 
C2 


这 let orig = Box::new(5); 

J DELTEIN! "{] "y torig}: 

4. let stolen = orig; // Error: use of moved value: ‘*orig 
ae 人 
Ge + 


代码 清单 5-1 中 的 unique_ptr 指 针 等 价 于 Rust 中 的 Box 二 TT 二 乔 能 指 
针 。 代 人 码 清 单 5-1 和 5-2， 均 是 利用 乔 能 指针 在 堆 上 分 配 了 内 存 ， 变 量 
orig 对 此 扒 内 存 持 有 所 有 权 《 唯 一 控制 权 ) ， 然 后 将 orig 香 新 赋予 变量 
Stolen. 

在 代码 清单 5-1 CCHR) 中 ， 使 用 了 move 函 数 ， 将 原来 的 
unidque_ptr 指 针 赋 了 予 了 stolean， 并 转让 了 所 有 权 。 原 来 的 orig WARN S TZ 
指针 ， 而 对 衬 指 针 解 引用 是 很 不 安全 的 ， 所 以 该 C++ 代 但 运行 时 融会 抛 
出 段 错误 (segmentation fault ) 。 但 对 于 开发 者 来 说 ， 最 想 要 的 是 一 
个 编译 期 的 保证， 因为 调试 运行 时 错误 比较 困难 ， 如 条 能 在 编译 时 肥 现 
隐 世 的 内 存 安全 问题 ， 允 会 方便 很 多 ， 对 于 代码 调试 和 稳定 运行 均 有 好 
Kh . 

而 代码 清单 5-2 (Rust 代 码 ) 在 编译 时 就 会 报错 。 编 译 器 提示 orig 是 


己 经 被“ 移动 ”的 什 。 这 里 的 “移动 ”在 语义 层面 与 C++ 代 介 中 的 move 函数 
等 价 。orig 已 经 将 所 有 权 转 让 给 了 stolen, Rust 编 详 医 检 栓 到 了 这 一 
尽 ， 发 现 这 里 存在 解 引 用 空 指针 的 安全 隐患 ， 然 后 束 报 错 了 。 

在 代码 清单 5-2 Rust 代码 ) 中 ， 并 没有 显 式 地 使 用 任何 类 似 现代 
C+t+ 中 的 move 函 数 来 转移 了 所有权， 却 拥 有 和 现代 C++ 一 样 的 效果 。 现 代 
C++ 中 的 RAI 机 制 虽然 也 有 上 所有权 的 概念 ， 但 其 作用 范围 非常 有 限 ， 仅 
智能 指针 有 所 有 权 ， 并 且 现 代 C++ 编 详 硕 也 并 没有 依据 所 有 权 进 行 严 格 
检查 ， 所 以 才 会 出 现代 码 清 单 5-1 那 样 的 解 引用 空 指针 的 运行 时 错误 。 
而 在 Rust 中 ， 所 有 权 古 系统 性 的 概念 ， 是 Rust 语 言 中 的 基础 设施 。Rust 
中 的 每 个 值 都 必定 有 一 个 唯一 控制 者 ， 即 ， 所 有 者 。 所 有 权 的 转移 都 是 
按 系 统 性 的 规则 隐 式 地 目 动 完成 的 ， 这 也 是 代码 清单 5-2 如 此 简洁 的 原 

Rust 的 所 有 权 系 统 与 法 律 上 “ 定 分 止 争 ”的 思想 是 不 谋 而 合 的 。 所 有 
权 系 统 让 每 个 值 都 有 了 明确 的 权 属 界限 ， 它 们 的 行为 也 有 了 明确 的 权 属 
FUR, KMARZAMA SSA Rh. WR UAT IM BSE A ee 
的 “法 律 ”， IA Rust Earme TCR NUE”, WAALS, tebe 
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5.1 通用 概念 


当今 计算 机 内 存 栈 和 堆 的 分 配 机 制 ， 决 定 了 编程 语言 中 的 值 主要 分 
为 两 类 : BERK (Value ) 和 引用 类 型 (Reference ) . 4% C, C++, 
Java、JavaScript、C# 等 语言 都 明确 对 值 类 型 和 引用 类 型 作 了 区 列 ， 而 
一 些 纯 面 癌 对 象 语言 只 剩 下 了 引用 类 型 的 概念 ， 比 如 在 Ruby 和 Python 
中 ， 一 切 篆 对 象 ， 而 对 象 融 是 引用 类 型 。 

值 类 型 是 指数 据 和 直接 存储 在 栈 中 的 数据 类 型 ， 一些 原 生 类 型 ， 比 
如 数值 、 布 尔 值 、 结 构 体 等 都 是 值 交 型。 因此 对 值 类 型 的 操作 效率 一 般 
比较 高 ， 使 用 完 立 即 会 被 回收 。 值 类 型 作为 右 值 〈 在 值 表达 陈 中 ) OA 
行 赋值 操作 时 ， 会 目 动 复制 一 个 狐 的 值 副 本 。 

引用 类 型 将 数据 存储 在 推 中 ， 而 栈 中 只 存放 指 癌 扒 中 数据 的 地 址 
(指针 ) ”，， 比 如 数组 、 字 符 串 等 。 因 此 对 引用 类 型 的 操作 效率 一 般 比 
较 低 ， 使 用 完 交 给 GC 回 收 ， 没 有 GC 的 语言 则 需要 靠 手 工 来 回收 。 

基本 的 原生 闫 型 、 结 构 体 和 枚 举 体 都 属于 全 次 型 。 普 通 引 用 次 型 、 
原生 指针 闫 型 等 都 属于 引用 类 型 。 但 随 独 语言 的 及 展 ， 类 型 越 来 越 丰 
理 ， 值 疾 型 和 引用 类 型 已 经 难以 描述 全 部 情况 ， 比 如 一 个 Vector 容 峰 类 
型 ， 其 内 部 可 以 包 人 基本 的 值 类 型 ， 也 可 以 包 人 名 引用 类 型 ， 那 它 属 于 什 
ZL FRAY? 

为 了 更 加 精准 地 对 这 种 情况 进行 描述 ， 值 语义 (Value Semantic 
) 和 引用 语义 (Reference Semantic ) 被 引入 ， 定 义 如 下 。 

IGM: 投 位 复制 以 后 ， 与 原始 对 象 无 天 。 

”引用 语义 : 也 叫 指针 语义 。 一 般 是 指 将 数据 存储 于 扒 内 存 中 ， 通 
过 栈 内 存 的 指针 来 官 理 堆 内 存 的 数据 ， 并 且 引 用 语义 禁止 按 位 复制 。 

按 位 复制 束 是 指 栈 复制 ， 也 叫 浅 复制 ， 它 只 复制 栈 上 的 数据 。 相 
对 而 言 ， 深 复制 惑 是 对 栈 上 和 扒 上 的 数据 一 起 复制 。 

值 语 义 可 以 保证 变量 值 的 独立 性 (Independence) 。 独 立 性 的 意思 
是 ， 如 果 想 修改 某 个 变量 ， 只 能 通过 它 本 喘 来 修改 ; 而 如 果 修 改 了 它 本 
二 ， 并 不 影响 其 复制 品 。 也 就 是 说 ， 如 果 只 能 通过 变量 本 冉 来 修改 值 ， 
那么 它 就 是 其 有 值 语 义 的 和 变量。 


而 引用 语义 则 是 茶 止 按 位 复制 的 ， 因 为 按 位 复制 只 能 复制 栈 上 的 指 
针 ， 扒 上 的 数据 束 多 了 一 个 管理 者 ， 多 了 一 层 内 存 安 全 的 隐 叫 。 图 5-1 
所 示 古 原生 整数 类 型 和 引用 类 型 按 位 复制 的 示意 图 。 
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let y = vec!/1, 2, 3]; 
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图 5-1: 原生 整数 类 型 和 引用 类 型 按 位 复制 示意 图 

图 5-1 中 变量 x 为 5， 是 整数 类 型 ， 变量 y 为 动态 数组 ， 是 Vector< 工 > 
类 型 。x 为 值 语义 ， 其 值 数据 都 存储 在 栈 上 ， 经 过 按 位 复制 ， 产 生男 外 
一 个 副本 ， 对 目 身 和 内 存 均 没有 什么 影响 。y 为 引用 语义 ， 其 值 数 据 是 
存储 在 堆 上 的 ， 栈 上 只 存放 一 个 指针 data_ptr 和 len 数 据 〈 为 了 简单 明 
了 ， 此 处 湖 略 其 他 元 数据 ) 。 将 y 进行 按 位 复制 以 后 ， 只 是 栈 上 的 指针 
和 元 数据 进行 了 复制 ， 扒 内 存 并 疫 有 发 生 复制 ， 于 是 束 产 生 了 两 个 指针 
党 理 独 同一 个 扒 衬 间 的 情况 。 这 样 市 来 的 问题 孢 是 ， 当 原生 指针 执行 了 
NYE Ja, FEW AEA CAR, BIS MITRE BS BA RE 
站 针 ， 造 成 无 法 预料 的 后 果 。 

在 第 2 章 介 绍 过 的 基本 的 原生 类 型 都 是 值 语 义 ， 这 些 类 型 也 被 称 为 
POD (Plain Old Data， 相 对 于 面 癌 对 象 语言 新 型 的 抽象 数据 而 言 ) 。 要 





注意 的 是 ，POD 类 型 部 走 值 语义 ， 但 值 语 义 类 型 并 不 一 定 部 是 POD 类 
型 。 具 有 值 语义 的 原生 类 型 ， 在 其 作为 右 值 进行 赋值 操作 时 ， 编 详 旧 会 
对 其 进行 按 位 复制 ， 如 代码 清单 5-3 所 示 。 

代 码 清单 5-3: 编译 帮 对 原生 类 型 进行 按 位 复制 


1 fn main() { 

2 let x = 5; 

oP let y = x; 

4 assert eqi(x, 35); 
5 assert eq! (y, 5); 
6 } 


代码 清 单 5-3 中 的 变量 x 为 整数 类 型 ， 当 它 作 为 右 值 赋值 给 变量 y 
上 时， 编译 器 会 默认 目 动 调用 x 的 clone 方 法 进行 按 位 复制 ”。x 是 值 语 义 类 
型 ， 被 复制 以 后 ，x 和 y 束 是 两 个 不 同 的 值 ， 互 不 影响。 

这 是 因为 整数 类 型 实现 了 Copy trait， 第 4 章 介 绍 过 ， 对 于 实现 Copy 
的 类 型 ， 其 clone 方 法 必须 是 按 位 复制 的 。 对 于 拥有 值 语 义 的 整数 类 型 ， 
整个 数据 存储 于 栈 中 ， 按 位 复制 以 后 ， 不 会 对 原 有 数据 造成 破坏 ， 不 存 
在 内 存 安 全 的 问题 。 

反观 C++， 当 对 象 作 为 右 值 参与 赋值 的 时 候 ， 一 般 会 建议 开发 者 目 
定义 实现 复制 构造 函数 ， 但 开发 者 很 有 可 能 态 记 这 样 做 ， 那 么 这 种 情况 
下 ， 编 译 右 束 会 默认 实现 复制 构造 水 数 来 进行 按 位 复制 ， 则 会 出 现 图 5- 
1 中 那样 的 内 存 安全 问题 ， 解 决 的 办 法 是 目 定 义 深 复 制 构造 函数 ， 将 堆 
上 的 数据 也 复制 一 遍 。 而 Rust 通 过 Copy 这 个 标记 trait， 将 类 型 按 值 语义 
和 引用 语义 做 了 精准 的 分 类 ， 和 帮助 编译 秦 检 疯 出 潜在 的 内 存 安全 问题 。 

智能 指针 Box<T> 封 装 了 原生 指针 ， 是 典型 的 引用 类 型 。Box<T 
> 无 法 实现 Copy， 意 味 看 它 被 Rust 标 记 为 了 引用 语义 ， 葵 止 实现 按 位 复 
制 ， 如 代码 清单 5-4 所 示 。 

代码 清单 5-4，Box<T > 无 法 实现 Copy 


q # [derive (Copy, Clone) ] 
2 struct Af{ 

Ef a? 232, 

4 b: Box<i32>, 

3 } 

6 fn main() {} 


Ss 5-43 PES TR RAR: 
error[E0204]: the trait “Copy may not be implemented for this type 
1 | #[derive (Debug, Copy, Clone) ] 


| NINANA 


4 | bY BoR<isZ>, 
| ieee this field does not implement ‘Copy 


Rust 编 译 器 阻止 了 Struct A 实 现 Copy， 因 为 Box<T > 是 引用 语义 ， 
如 果 按 位 复制 ， 会 有 内 存 安 全 隐患 。 

值得 注意 的 是 ， 虽 然 引 用 语义 类 型 不 能 实现 Copy， 但 可 以 实现 
Clone 的 clone 方 法 ， 以 实现 深 复制 ， 在 种 要 的 时 候 可 以 显 式 调用 。 


5.2 所 有 权 机 制 


在 Rust 中 ， 由 Copy trait 来 区 分 值 语 义 和 引 用 语义 。 与 此 同时 ，Rust 
也 引入 了 新 的 语义 : 复制 (Copy ) 语义 和 移动 (Move ) 语义 。 复 
制 语义 对 应 值 语 义 ， 移 动 语义 对 应 引用 语义 。 这 样 划 分 是 因为 引入 了 所 
有 权 机 制 ， 在 所 有 权 机 制 下 同时 保证 内 存 安 全 和 性 能 。 

对 于 可 以 安全 地 在 栈 上 进行 控 位 复制 的 类 型 ， 束 只 圾 要 按 位 复制 ， 
也 方便 管理 内 存 。 对 于 在 堆 上 和 存储 的 数据 ， 因 为 无 法 安全 地 在 栈 上 进行 
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全 ， 还 可 以 拥有 与 栈 复制 同样 的 性 能 。 

在 下 面 的 代码 清单 5-5 中 ， 变 量 x 是 Box<T 之 类 型 ， 当 赋值 给 变量 y 
时 ， 稚 认 行 为 不 是 按 位 复制 ， 而 是 移动 ， 如 图 5-2 所 示 。 

代码 清早 5-5: 其 有 引用 语义 的 Box 二 TT 二 默认 会 移动 

fn main () { 
let x = Box: :new()5); 


1 

2 

3, let y = x; 
4 和 
5 
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一 let x = Box::new(5); 
let y = x; 





图 5-2， 移 动 Box<T 之 类 型 变量 示意 图 

因为 不 会 进行 按 位 复制 ， 所 以 只 是 把 x 的 指针 重新 指向 了 y， 完 全 杜 
绝 了 图 5-1 中 出 现 的 两 个 指针 引用 同一 个 推 空间 的 情况 ， 保 证 了 内 存 安 

在 代码 清单 5-5 中 ， 起 初 变量 x 对 Box<T> 拥 有 所 有 权 ， 随 后 x 将 
Box<T 之 通过 移动 转移 给 了 y， 那 么 最 终 y 拥 有 了 Box< 工 > 的 所 有 权 ， 
所 以 由 它 来 释放 Box<T> 的 堆 内 存 。 

一 个 值 的 所 有 权 梓 转移 给 另外 一 个 变量 绑 定 的 过 程 ， 残 叫 作 所 有 
权 转 移 。 

Rust 中 每 个 值 都 有 一 个 所 有 者 ， 更 进一步 说 就 是 ，Rust 中 分 配 的 每 
块 内 存 都 有 其 所 有 者 ， 所 有 者 负责 该 内 存 的 释放 和 读 写 权限 ， 并 且 每 次 
每 个 值 只 能 有 唯一 的 所 有 者 。 这 束 古 Rust 的 所 有 权 机 制 = COwnerShip 
J s 

所 有 权 的 类 型 系统 理论 


Rust ATA MERA RR PRAT RAY (affine type) , € 
属于 类 型 理论 中 子 结 构 类 型 系统 〈 Substructural Type System ) 的 概 
te TARH ARM ee F244 (Substructural Logic ) 在 类 型 系 
统 中 的 应 用 。 而 子 结构 逻辑 属于 证 明理 论 里 的 推理 规划， 其 规则 包含 如 
PILE. 

线性 逻辑 (Linear Logic) ， 如 果菜 个 变量 符合 菜 种 特定 的 “ 结 
构 ”， 它 束 内 含 一 种 规则 ;必须 且 只 能 使 用 一 炊 。 

Hpi es (Affine Logic) ， 和 线性 逻辑 是 类 似 的 ， 但 它 的 规则 
征 ， 最 多 使 用 一 次 ， 也 融 是 说 ， 可 以 使 用 0 次 或 1 次 。 看 上 去 线性 馆 辑 更 
Je RR — HG 

其他。 

于 结构 逻辑 规则 用 于 推理 。 基 于 仿 射 次 型 ，Rust 实 现 了 所有权 机 
制 ， 在 需要 移动 的 时 候 目 动 移动 ， 维 护 了 内 人 存 安全 。 

所 有 权 的 特点 

所 有 者 拥有 以 下 三 种 权限 : 

控制 资源 (不 仅 仪 是 内 存 〉 的 释放 。 

fe ATA, EGAN AE CSE) WMA (独占 ) 的 。 

转移 有 所有权 。 

对 于 实现 Copy 的 类 型 ， 也 束 古 复制 语义 类 型 来 说 ， 按 位 复制 并 不 
会 出 现 内 存 问 题 ， 并 且 可 以 简化 内 存 定 理 。 所 以 在 赋值 操作 时 ， 作 为 右 
值 的 杰 量 会 默认 进行 按 位 复制 。 但 是 对 于 茶 止 实现 Copy 的 闫 型 ， 也 残 是 
移动 语义 类型 来 说 ， 如 采 对 其 执行 按 位 复制 ， 吏 会 出 现 图 5-1 所 示 的 重 
复 释 放 同 一 氛 扒 内 存 的 问题 ， 所 以 在 进行 赋值 操作 时 ， 作 为 右 值 的 变量 
会 默认 执行 移动 语义 来 转移 所 有 权 ， 从 而 保证 了 内 存 安 全 。 

对 于 可 以 实现 Copy 的 复制 语义 类 型 来 说 ， 所 有 权 并 未 改变 。 对 于 
复合 类 型 来 说 ， 是 复制 还 是 移动 ， 取 决 于 其 成 员 的 类 型 。 代 码 清 单 5-6 
所 示 的 是 结构 体 成 员 都 为 复制 语义 类 型 的 情况 。 

代码 清 单 5-6: 结构 体 A 的 成 员 都 为 复制 语义 类 型 


# [derive (Debug) ] 
struct Af 


fn main() { 
let a =A {a: 1, b: 2}; 


let b = a; // error[E0382]: use of moved value: `a 
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prantint (7:2), aj; 


|] 


代码 清单 5-6 的 第 8 行 编译 会 报错 ， 说 明 在 进行 赋值 操作 时 ，a 的 所 
有 权 发 生 了 转移 。 在 后 面 的 printn! 语句 中 ，a 就 无 法 再 次 使 用 。 

可 见 ， 虽 然 结构 体 A 的 成 员 都 是 复制 语义 类 型 ， 但 是 Rust 并 不 会 于 
认为 其 实现 Copy， 如 果 想 解决 这 个 问题 ， 可 以 手动 为 结构 体 A 实 现 
Copy， 如 代码 清单 5-7 所 示 。 

代码 清单 5-7: 手动 为 结构 体 A 实 现 Copy 

1. #[derive (Debug, Copy, Clone) ] 
struct A 


2 
3 
4 
Pa } 
6 fn main() { 
7 let a = A {a: 1, b: 2}; 
8 let b = a; 
9 全 和 
Lu. 4 
在 代码 清单 5-7 中 ， 通 过 # [derive (Debug, Copy, Clone) ] 属性 
为 结构 体 A 实 现 了 Copy， 因 此 结构 体 A 束 可 以 按 位 复制 了 ， 所 以 这 上 段 代 
码 可 以 正常 编译 运行 。 我 们 在 代码 清单 5-4 中 己 经 看 到 ， 如 果 结 构 体 中 
还 有 移动 语义 类 型 的 成 员 ， 则 无 法 实现 Copy。 因 为 按 位 复制 可 能 会 引 友 
内 存 安全 问题 。 
枚 举 体 和 结构 体 是 类 似 的 ， 当 成 员 均 为 复制 语义 类 型 时 ， 不 会 日 动 


实现 Copy。 而 对 于 元 组 类 型 来 说 ， 其 本 号 实现 了 Copy， 如 果 元 系 均 为 
复制 语义 类 型 ， 则 默认 是 按 位 复制 的 ， 否 则 会 执行 移动 语义 ， 如 代码 清 
单 5-8 所 示 。 

代码 清单 5-8: 当 元 素 均 为 复制 语义 类 型 时 ， 元 组 目 动 实现 Copy 


1 fn main () { 

2 leE a = ST Ee Strang(), "ET, TO SEEING)? 
E let b = a; 

4 Af Brinclinl (Legis, Be 

ae let @ = (lyZes)3 

6 let d= c; 

7 BET ez 

8 } 


在 代码 清单 5-8 中 ， 变 量 a 为 元 组 和 型 ， 其 元 素 为 String 关 型 ， 并 非 
值 语义 类 型 ， 变 量 a 在 作为 右 值 进行 赋值 操作 时 ， 转 移 了 了 所有权， 所 以 
fEprintin! 中 使 用 变量 a 会 报错 。 变 量 c 也 是 元 组 类 型 ， 其 元 系 均 为 整数 
类 型 ， 走 复制 语义 类 型 ， 文 持 控 位 复制 ， 所 以 变量 c 在 作为 右 值 进 行 赋 
值 操 作 后 依然 可 用 。 

数组 和 Option 类 型 与 元 组 类 型 部 避 人 循 这 样 的 规则 : 如果 元 系 部 十 复 
制 语义 类 型 ， 也 就 古都 实现 了 Copy， 那 么 它们 就 可 以 按 位 复制 ， 否 则 整 
转移 所 有 权 。 


5.3 FBE VEH ERAI E fn J HH 


Rust 使 用 let 关键 字 来 声明 “变量 ”。let 关键 字 属 于 函数 式 语言 中 的 
传统 关键 字 ， 比 如 Scheme、OCaml、Haskel 等 语言 也 都 使 用 let 天 键 字 来 
声明 “变量 ”。let 有 jlet binding 之 意 ，jlet 声 明 的 “变量 ”实际 上 不 是 传统 意义 
上 的 变量 ， 而 是 指 一 种 绑 定 语义 ， 如 代码 清单 5-9 所 示 。 

代码 清单 5-9: let 

Dg fn main() { 


2 LEE è = Hello”. Eo Strarig {) ; 
ee ft 


在 代码 清单 5-9 F, let 的 意义 是 这 样 的 : 标识 从 a 和 String KHF 
AFH "hello" 通过 jlet 绑 定 在 了 一 起 ，a 拥 有 字符 串 " hello" 的 所 有 权 。 
更 深层 次 的 意义 是 ，let 绑 定 了 标识 符 a 和 存储 字符 串 "hello " 的 那 块 内 
存 ， 从 而 a 对 那 块 内 存 拥 有 了 所 有 权 。 上 所 以 此 处 a 被 称 为 绑 定 > KEPP 
的 “变量 关 变 量 绑 定 ?或 “ 绑 定 ”， 均 是 指 “ 绑 定 ” 的 。 

如 果 此 时 使 用 let 声 明 另 一 个 绑 定 b， 并 将 a 赋 值 给 b， 如 letb=a， 则 此 
时 必然 会 将 a 对 字符 串 的 所 有 权 转 移 给 b。 因 为 a 是 String 类 型 ， 不 能 实现 
Copy， 所 以 这 种 行为 其 实 也 可 以 理解 为 对 a 进 行 解 绑 ， 然 后 重新 绑 定 给 
bo 


5.3.1 AA nA 


“共享 可 变 状态 是 万 恶 之 源 "， 这 句 在 业界 流传 已 久 的 名 言 诉说 着 这 
样 一 个 事实 ， 可 变 状态 绝 不 能 共享 ， 和 否则 会 增加 函数 之 间 的 耦合 度 ， 函 
数 中 的 变量 状态 在 任何 时 候 发 生 改变 都 将 变 得 难以 控制 ， 从 而 让 函数 产 
生 < 副 作用 ”。 可 变 状态 也 更 不 利于 多 线程 并 发 程序 ， 容 易 引 发 数据 况 
争 。 

在 很 多 传统 的 编程 语言 中 ， 变 量 均 为 默认 可 变 的 ， 开 发 者 很 难 避 
免 “共享 可 变 状 态 ”。 随 着 近 几 年 来 函数 式 编程 语言 的 逐渐 流行 ， 其 显著 
的 优点 也 开始 受到 关注 ， 其 中 不 可 变 。 (Immutable ) ff) A Z 


渐 体 现 了 出 来 : 

多 线程 并 友 时 ， 不 可 变 的 数据 可 以 安全 地 在 线程 间 共 至 。 

` 函数 的 “副作用 ”可 以 得 到 控制 。 

Rust 语 言 吸收 了 郴 数 陈 语言 的 诸多 优势 ， 其 中 之 一 束 是 声明 的 绑 定 
默认 为 不 可 变 ， 如 代码 清单 5-10 所 示 。 

代码 清单 5-10: 绑 定 默认 为 不 可 变 


il fn main() { 

2 Let X = "hello”".to string |); 

3. // cannot borrow immutable local variable ‘x as mutable 
4 // x +=" world": 

» sf 


在 代码 清单 5-10 中 ， 第 4 行 代码 中 的 += 操 作 相 当 于 x=x+ " world" , 
这 样 的 操作 在 传统 的 变量 默认 可 变 的 语言 中 很 党 见 。 但 是 在 Rust 中 ， 编 
译 嚣 会 报 出 第 3 行 注 释 所 示 的 错误 。 绑 定 x 默 认为 不 可 变 ， 所 以 编译 器 不 
允许 修改 一 个 不 可 变 的 绑 定 。 

如 果 和 需要 修改 ，Rust 提供 了 一 个 mut 天 键 字 ， 可 以 用 它 来 声明 可 变 
(Mutable〉 绑 定 ， 如 代码 清早 5-11 所 示 。 

代码 清单 5-11: 使 用 mut 声 明 可 变 绑 定 


Le En mainly 4 

2 let mut x = “hello” sto String (yy 
3. = 9% Worle"? 

4 assert eq! ("hello world”, xj} 

Da } 
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5.3.2 3b xe HY AY IB] Jeg PE 生命 周期 

变量 绑 定 具有 “时 空 ”双重 属性 。 

:空间 属性 是 指标 识 符 与 内 存 空间 进行 了 绑 定 。 

:时间 属性 是 指 绑 定 的 时 效 性 ， 也 束 是 指 它 的 生存 周期 。 


一 个 绑 定 的 生存 周期 也 被 称 为 生命 周期 lifetime ) ， 是 和 词法 作 
用 域 有 关 的 。 代 人 码 清单 5-9 中 的 绑 定 a 的 生命 周期 就 是 整个 main 作 用 域 。 
作为 栈 变 量 ，a 会 随 看 main 函 数 栈 帧 的 销 蝶 而 锐 清 理 。 并 且 ， 这 是 编译 
器 可 以 知道 的 事实 。 

其 实 每 个 let 声明 都 会 创建 一 个 默认 的 词法 作用 域 ， 该 作用 域 束 是 
它 的 生命 周期 ， 如 代码 清单 5-12 所 示 。 

代码 清单 5-12: let 默 认 创 建 词法 作用 域 


tls fn main () { 

By let a = "hello"; 
Bhs let b = "rust"; 
4. let c = "world"; 
Fa let d = c; 

6. } 


代码 清单 5-12 中 声明 了 4 个 let 绑 定 ，a、b、c、d， 它 们 均 有 一 个 默 
认 的 隐 式 的 词法 作用 域 ， 可 以 通过 伪 代 人 码 表 示 如 下 : 


la { 
let a = "hello"; 
ID { 
let b = “rust”; 
IC { 
let c = "world"; 
'd 1 
let d = cC} 
t A FAS 'd 
P // FAI, "e 
} // 作用 域 'b 
} // 作用 域 'a 


看 得 出 来 ， 绑 定 a 的 作用 域 包 侣 着 ” b、”c、 ”dd 的 作用 域 ， 以 此 次 
推 ， 最 后 声明 的 绑 定 的 作用 域 在 最 里 面 。 

绑 定 的 析 构 顺序 和 声明 顺序 相反 ， 所 以 绑 定 d 的 生命 周期 是 最 短 
的 ，d 会 完 析 构 ， 然 后 ce、b、a 依 次 析 构 ， 所 以 a 的 生命 周期 好 长。 所 


LX, Any Rust anal ee PAVESI, GaP as fe BA Fl eR Z 
由 部 这 些 局 部 变量 绑 定 的 生命 周期 。 

当 问 绑 定 在 词法 作用 域 中 传递 的 时 候 ， 吏 会 产生 所 有 权 的 转移 。 代 
但 清单 5-10 中 的 绑 定 c 作 为 右 值 被 赋 值 给 绑 定 4， 绑 定 c 进 入 了 绑 定 d 的 作 
用 域内 ， 按 理应 该 会 肥 生 所 有 权 的 转移 ， 但 是 因为 c 为 字符 种 字面 量 ， 
文 持 投 位 复制 ， 所 以 此 时 c 并 没有 及 生 所 有 权 转 移 ， 依 然 可 用 。 绑 定 生 
命 周期 的 示意 图 请 参见 图 5-3。 


fn main(){ 


let a = "hello"; 
let b = "rust"; 
let c = "world": 


let d = C; 





图 5-3: 绑 定 生命 周期 示意 图 

综 上 所 述 ，let 绑 定 会 创建 狐 的 词法 作用 域 ， 如 果 有 其 他 变量 作为 石 
值 进 行 赋值 操作 ， 也 就 十 乡 定 操 作 ， 那 么 该 变量 因为 进入 了 let 创建 的 
词法 作用 域 ， 所 以 要 么 转移 了 所有权 ， 要 么 按 位 复制 ， 这 取决 于 该 和 变量 是 
复制 语义 还 是 移动 语义 的 。 

除了 let 声 明 ， 还 有 一 些 场景 会 创建 新 的 词法 作用 匡 。 

tas 

可 以 使 用 花 括 号 在 函数 体内 创建 词法 作用 域 ， 如 代码 清单 5-13 所 
ZN o 

代码 清单 5-13: 使 用 伦 括 扎 创 建 词 法 作用 域 


i} fn main () { 

2 let. outer val = 1; 

3 let oucer sp = "ollo .bo String()s 

4 

A, let inner val = zi 

6 outer Val; 

7 outer sp; 

8 } 

9 BEINCIN: (ite) GULSE VaL) 

TU // error[E0425]: cannot find value ‘inner val in this scope 
ls // peintin! ("{2?}", inner val); 

12, // error[E0382]: use of moved value: ‘outer sp` 
13. //? DEINEN! ("{22}", cuter sp); 

14. } 


在 代码 清单 5-13 中 ， 第 4 行 和 第 8 行 的 伦 括 号 在 main 词 法 作用 二 中 又 
创建 了 一 个 内 部 的 作用 域 。 第 5 行 let 声 明 的 绑 定 inner_val 的 生命 周期 也 
只 存活 于 此 内 部 作用 域 ， 一 旦 出 了 内 部 作用 域 ， 允 会 被 析 构 。 所 以 如 末 
取消 第 11 行 的 注释 ， 编 详 时 融会 过 到 第 10 行 注释 中 的 报错 内 容 。 

第 2 行 声 明 的 outer_val 是 复制 语义 次 型 ， 在 进入 内 部 作用 域 之 后 ， 
不 会 转移 所 有 权 ， 而 只 是 按 位 复制 ， 所 以 ， 在 第 9 行 出 了 内 部 作用 域 之 
Ja, Wa 以 继续 使 用 outer_val。 第 3 行 声 明 的 outer_ sp 是 引 用 语义 类 型 ， 
在 进入 内 部 作用 域 之 后 ， 它 的 所 有 权 被 转移 ， 出 了 内 部 作用 域 之 后 ， 
outer_sp 束 会 被 析 构 ， 所 以 如 果 取 消 第 13 行 的 注释 ， 编 译 的 时 候 束 会 出 
DLS L247 ERE WIR A 

SESE AN UM xe JHE I Ft Ss SP AE AEE FA ak, FE #Ematch/b 
Ac. ME eae A) else Ara H Sea > NS AB er AE aE FD 
域 。 

match//L fc 

match 匹 配 也 会 产生 一 个 新 的 词法 作用 域 ， 如 代码 清单 5-14 所 示 。 

代码 清单 5-14:， match 玫 配 会 产生 新 的 词法 作用 域 


1 fn main() { 

2 let a = some( Nello” tH String 4) y} 

3 NAEH & 4 ff = 

4 Some(s) => printlin! ("{:?}", s), // | match scope 
By _ => println! ("nothing") ff | 

0 be 

J // error[E0382]: use of partially moved value: ‘a 

8 7; Deana! (fet. Ala 

9 } 


代码 清单 5-14 中 的 match 匹 配 会 创建 新 的 作用 域 ， 绑 定 a 的 所 有 权 会 
MRM, KI AhpE axe Option< String> KH, StringRA AA Baia x, 
Fr LXOption< String > Wize wath LAA. WR BIT EASE a, WI 
会 报 第 7 行 注 释 所 示 的 错误 。 在 match 语 名 内部， 每 个 匹配 分 文 都 是 独立 
的 词法 作用 域 ， 比 如 第 4 行 代码 中 的 s 只 能 用 于 该 分 文 。 

循环 语句 

for、loop 以 及 while 循 环 语 句 均 可 以 创建 新 的 作用 域 。 代 码 清单 5-15 
展示 了 for 循 坏 语 句 创 建 狐 的 作用 域 的 示例 。 

代码 清单 5-15: for 循 环 语 句 创 建新 的 作用 域 


1 fn main() { 

2 let v = vec! [1,2,3] 

3 ne ak dn 

4. 1 由 F 

5. // error[E0382]: use of moved value: ‘v’ // | for scope 
6 fy phinklal (ei JIS, wie // | 

7 |} 人 = 

8. } 


在 代 但 清单 5-15 中 ， 绑 定 v 为 移动 语义 类 型 ， 进 入 for 循 环 时 已 经 转 
移 了 上 所有权， 所 以 当 第 6 行 再 次 使 用 绑 定 Vv 时 ， 束 会 报 第 5 行 注 释 所 示 的 
aF 

if let# while let 块 

if letik Awhile leth 1422 GI) Gtr NEHE, A 5-16 EN JS if let 


块 创建 新 的 作用 域 的 示例 。 
代码 清单 5-16: flet 块 创建 新 的 作用 域 


i fn main() { 

a let a = Some("hello".to string()); 

Be if let Some(s) =a { // ------- 

4. Beato! CLEP, 8) //| if let scope 
Die jf fewer eee i 

6. 


在 代码 消 时 5-16 中 ， 绑 定 a 为 引用 语义 ， 因 为 是 Option 二 String 二 类 
型 ， 所 以 在 第 3 行 让 let 的 赋值 操作 中 会 转移 所 有 权 ， 绑 定 a 将 不 再 可 用 。 
而 让 let 据 也 创建 了 一 个 新 的 作用 域 。 

代码 清单 5-17 展 示 了 while let 块 创建 新 作用 域 的 示例 。 

代码 清单 5-17: while let 块 创建 新 的 作用 域 


1 fn main() { 

2 let mut optional = Some (0) ; 

g while let Some(i) = optional { 

4 i, i o> of 

as println! ("Greater than 9, guit") 
6 optional = None; 

p: } else { 

8 prinrinti¢g”’ 1° 18 447) r Try Seatac”, 1); 
P optional = Some(i + 1); 

LO } 

Ll } 

IZ } 


在 代码 清单 5-17 中 ， 变 量 optional 为 Option<i32 之 类 型 ， 因 为 让 2 类 
型 为 复制 语义 ， 所 以 Option 二 i32 二 为 复制 语义 。 因 此 在 while let 匹配 
后 ， 变 量 i 的 所 有 权 并 未 转移 。 

函数 

函数 体 本 身 是 独立 的 词法 作用 域 。 当 复制 语义 类 型 作为 函数 参数 
时 ， 会 投 位 复制 ， 如 末 十 移动 语义 作为 函数 参数 ， 则 会 转移 所 有 权 ， 如 
代码 清单 5-18 所 示 。 


代码 清单 5-18: 引用 移动 语义 类 型 作为 函数 参数 


im tfogtss Sirino) ~ String | Jy === 
let w = " world".to string(); // | function scope 
S + &W // | 

} // -------------------------------- 


fn main() { 
Ler S = “nelle ste Serene) § 
let ss = f00(s); 
// printlin! ("{:?}", s) // Error: use of moved value: "s` 


代码 清单 5-18 中 的 绑 定 $ 为 String 关 型 ， 当 它 作 为 参数 传 入 foo 函 数 中 
时 ， 所 有 权 会 被 转移 。 如 果 在 main 函 数 中 再 次 使 用 绑 定 s， 则 编译 时 会 
报错 。 

闭 包 

闭 包 会 创建 新 的 作用 域 ， 对 于 环境 变量 来 说 有 以 下 三 种 捕获 方式 : 

` 对 于 复制 语义 类 型 ， 以 不 可 变 引 用 〈&T) 来 捕获 。 

: 对 于 移动 语义 类 型 ， 执 行 移动 语义 (move) 转移 所 有 权 来 捕获 。 

对 于 可 变 绑 定 ， 如 果 在 财 包 中 包含 对 其 进行 修改 的 操作 ， 则 以 可 
变 引 用 (&mut) 来 捕获 。 

代码 清单 5-19 展 示 了 上 述 第 二 种 捕获 。 

代码 清单 5-19: 外 部 变量 为 移动 语义 类 型 ， 则 转移 所 有 权 来 进行 
捕获 


ls tinmain(t) 1 


ma Oa ot ds G P COR 


let s = “hello”,to string(); 
let join = |i: &str| {s + i}; // moved s into closure scope 
assert eq! ("hello world", join(" world") ); 


// println! ("{:2}", s); // error[E0382]: use of moved value: ‘s° 


YF wn B te WS 


} 

在 代码 清单 5-19 中 ， 绑 定 $ 为 String 类 型 ， 被 第 3 行 声 明 的 财 包 join 捕 
获 ， 所 以 s 的 所 有 权 被 转移 到 了 闭 包 中 。 如 果 第 5 行 再 次 使 用 s， 则 编译 
A Ze ICE 0 


5.4 所 有 权 信 用 


假设 需要 写 一 个 函数 ， 用 于 修改 数组 的 第 一 个 元 素 。 基 本 思路 可 以 
是 ， 将 此 数组 直接 当 作 函数 的 参数 传 入 ， 修 改 之 后 册 返 回 ， 如 代 但 清单 
5-20 所 示 。 

代码 清单 5-20: 将 数组 作为 函数 参数 传递 


is th roo (mut we [L327 Sl} => [T1323 a] i 
2 v[O] = 3; 

3 assert. eq! ([3,2,3], wW 

4. V 

an J 

6 fn main() { 

7 let v = [1,2,3]; 

8 foo (v); 

Ds assert eq! ([1.2,3], vie 

L1G. 2 


在 代码 清早 5-20 中 ， 因 为 数组 类 型 签名 为 [T; N], Prelfoork žit 
数 v 的 类 型 直接 指定 为 [i32; 3]， 代 表 长 眼 为 3 的 32 整数 数组 ， 并 使 用 
mut 关 键 字 将 其 指定 为 可 变 。 在 foo 了 浮 数 中 ， 直 接 使 用 数组 下 标 0 来 修改 
第 一 个 元 又 的 但 ， 然 后 返回 此 数组 。 

在 main 隙 数 中 ， 第 7 行 代码 声明 了 一 个 不 可 变数 组 v， 然 后 将 其 传 入 
foo 国 数 中 。 因 为 数组 v 的 元 系 均 为 基本 数字 类型 ， 所 以 v 是 复制 语义 ， 
在 传 入 foo 函 数 时 会 投 位 复制 。 所 以 ， 在 foo 函 数 中 修改 后 的 v 是 [3，2， 
3]， 而 main 国 数 中 的 v 是 [1L，2，3]《〈 代 人 码 第 9 行 ) 。 

这 里 还 需要 注意 的 地 方 是 ， 第 7 行 代码 声明 的 数组 v 是 不 可 变 的， 但 
是 传 入 了 了 foo 函数 中 束 变 成 了 可 变数 组 ， 主 要 原因 是 疯 数 参数 签名 也 文 
FRAILE ， 相 当 于 使 用 let 将 Vv 重新 声明 成 了 可 变 绑 定 。 

所 以 ， 如 果 想 使 用 foo 函 数 返 回 的 修改 后 的 数组 ， 则 需要 将 其 重新 
绑 定 方 可 继续 使 用 。 这 是 所 有 权 系 统 市 来 的 不 便 之 处 。 其 实 大 多 数 情况 
下 可 以 使 用 Rust 提 供 的 引用 来 处 理 这 种 情况 ， 如 代码 清单 5-21 所 示 。 


Sis 5-21: 使 用 引用 作为 函数 参数 
ls fn Foo(ve Smut [2327 3J} 4 
v[0] = 3; 
} 
fn main() { 
let mut v = [1,2,3]; 
foo(&mut v); 


assert eq! ([3-2s3]l, Y)? 


O ~~] OO OF F&F U N 


} 


代码 清单 5-21 比 代码 清单 5-20 更 加 精练 。 因 为 使 用 了 可 变 引 用 &mnut 
V， a. aa 了 要 有 返回 值 ， 当 foo 函 数 调 用 完毕 时 ，v 依 旧 可 用 。 
BEA] HI Sete FUE HUE» HH fer AT DY i ZEB Bt ZL ZS 
可 ae 第 6 行 借用 了 &mut v, AAEM foorki Bia H sé EZ Ja A 
了 所 有 权 ， 上 所 以 在 第 7 行 代码 中 还 可 以 继续 使 用 v。 

引用 与 信用 

引用 (Reference ) 是 Rust 提供 的 一 种 指针 语义 。 引 用 是 基于 指针 
的 实现 ， 它 与 指针 的 区 别 是 ， 指 针 人 和 存 的 是 其 指 回 内 存 的 地 址 ， 而 引用 
可 以 看 作 某 块 内 存 的 别名 (Alias ) ， 使 用 它 需 要 满足 编译 器 的 各 种 安 
全 检查 规则 。5 引 用 也 分 为 不 可 变 引 用 和 可 变 引 用 o EHR EITA 
可 变 引 用 ， 使 用 &mut 符 号 进行 可 变 引 用 。 

在 所 有 权 系 统 中 ， 引 用 &x 也 可 称 为 xX 的 人 用 (Borrowing ) ， 通 过 
& 探 作 符 来 完成 所 有 权 租 信 。 既 然 是 信用 所 有 权 ， 那 么 引用 并 不 会 造成 
绑 定 变量 所 有 权 的 转移 。 但 是 借用 所 有 权 会 让 所 有 者 (owner ) 受到 
如 下 限制 : 

: 在 不 可 变 借用 期 间 ， 所 有 者 不 能 修改 资源 ， 并 且 也 不 能 再 进行 可 
AS Et H o 

:在 可 变 借用 期 间 ， 所 有 者 不 能 访问 资源 ， 并 有 晶 也 不 能 再 出 借 所 有 
权 。 

引用 在 离开 作用 域 之 时 ， 残 是 其 归还 所 有 权 之 时 。 使 用 借用 ， 与 
直接 使 用 拥有 上 所有权 的 et 目 然 ， 而 且 还 不 需要 转移 所 有 权 。 

再 看 男 外 一 个 示例 ， 这 是 一 个 冒 泡 排序 的 实现 ， 如 代码 清单 5-22 所 


代码 清单 5-22: 冒 泡 排序 

1 fn bubble sort(a: &mut Vec<i32>) | 

2 let mut n = a.len(); // 获取 数组 长 度 

3 while n> 0O { 

4 // 初始 化 遍历 游标 ，max ptr 始终 指向 取 大 值 

5. let (mut 1, Mut max ptr) = (71, 0); 

6 // 冒 泡 开始 ， 如 果 前 者 大 于 后 者 ， 则 互 换 位 置 ， 并 设置 当前 最 大 值 游标 
7 while i<n { 

8 if a[i-l] > a[i] { 

9 


a.swap(i-l, i); 


LO. max ptr = 1; 

Ll } 

Le. i+ 13 

les } 

14, // 本 次 遍历 的 最 大 值 位 置 也 是 下 一 轮 冒 泡 的 终点 
la n = Max Ptr; 

VG. ] 

rt. f 

18. fn main() { 

19; let mut a = yaci[l; 4, 3, 3, 2i 

20. bubble sort (smut a); 

Pl. | 
bas | 


在 代码 清单 5-22 中 ，bubble_sort 函 数 参 数 为 可 变 借用 。 第 2 行 中 直接 
使 用 a 来 调用 len 方 法 ， 以 便 获 取 数 组 的 长 度 ， 而 不 是 先 用 解 引 用 操作 符 
对 a 解 引用 ， 然 后 再 调用 len 方 法 〈 当 然 ， 这 样 调用 也 可 以 ) 。 同 样 的 用 
法 还 有 第 9 行 中 的 aswap Gi-l, i) ， 用 于 交换 指定 索引 的 元 素 在 数组 中 
的 位 置 。 

代码 清单 5-23 展 示 J std: ; VEC: : Vec 中 len C) 方法 的 源码 实 
现 。 

代码 清单 5-23: len © 方法 源码 


1. pub fn len(&self) -> usize { 
Zs self.len 
Ra } 


在 代码 清单 5-23 中 ，len 方 法 中 的 &self 实 际 上 是 self: &self 的 简写 ， 
因此 ， 可 以 在 方法 体 中 直接 使 用 self 来 调用 len 字 段 。 这 同样 利用 了 函 数 
参数 的 模式 匹配 。 由 此 可 见 ， 通 过 信用 ， 开 有 者 可 以 在 不 转移 所 有 权 的 
情况 下 ， 更 加 方便 地 对 内 存 进行 操作 ， 同 时 也 让 代码 有 民 好 的 可 读 性 和 
维护 性 。 

借用 规则 

为 了 保证 内 存 安全 ， 借 用 必须 加 人 循 以 下 三 个 规则 。 

- 规则 一 :借用 的 生命 周期 不 能 长 于 出 借方 (拥有 所 有 权 的 对 象 ) 
的 生命 周期 。 

”规则 二 : 可 变 借 用 《〈 引 用) 不 能 有 别名 Alias) ， 因 为 可 变 代用 
具有 独占 性 。 

:规则 三 : 不 可 变价 用 (引用) 不 能 再 次 出 借 为 可 变 借 用 。 

WA SPIES. PWS MSA UZ AAR 
的 原则 : FESR ANAT AR, BAe ASE o Ruste as 2 BU” te HY fe H i 
但， 违反 以 上 规则 的 行为 均 无 法 正常 通过 编译 。 

规则 一 很 好 理解 。 如 果 出 借方 已 经 被 析 构 了 ， 但 借用 依然 存在 ， 础 
会 产生 一 个 悬垂 指针 ， 这 是 Rust 绝 对 不 允许 出 现 的 情况 。 

规则 二 和 规则 三 摘 述 的 不 可 变 倍 用 和 可 变 借 用 残 相 当 于 内 存 的 庶 与 
锁 ， 同 一 时 刻 ， 只 能 拥有 一 个 与 锁 ， 或 者 多 个 读 锁 ， 不 能 同时 拥有 ， 如 
多 5-4 所 示 。 


读 操作 线程 


读 操作 线程 


开始 旋 
写 操作 线程 一 一 Q At t< 





图 5-4: 内 存 读 写 锁 示 意图 
不 可 变 信 用 可 以 被 出 信 多 次 ， 因 为 它 不 能 修改 内 存 数据 ， 因 此 它 也 
航 称 为 共 且 信用 《“ 引 用) 。 可 变 信 用 只 能 出 们 一 次 ， 人 否则 ， 难 以 预料 数 
据 何 时 何 地 会 被 修改 。 
接 下 来 我 们 一 起 分 析 一 下 代码 清单 5-24。 
代 查 清单 5-24: 信用 检查 你 障 了 内 存 安全 


1. fn compute(input: &u32, output: &mut u32) A 
Fm LE *input > 10 { 

cr *output = 1; 

4. } 

oo LE “shies > 54 

Bing *opbput “= 2} 

Tx } 

0.. } 

9. En main() { 

LG let i = 20; 

Tis let mut o = 5; 

12. compute (&i, &mut o); // o = 2 


IRADIA E 5-24 AP UEA mE, AR o 的 绪 末 会 要 修改 为 2。 但 
是 现在 假如 不 存在 Rust 的 借用 检查 ， 我 们 来 看 看 该 函数 可 能 会 存在 什么 
问题 。 

如 末 声 明 一 个 绑 定 ， 并 且 把 访 绑 定 的 可 变 借 用 和 不 可 变 信 用 都 传 入 
computer, SRASP AWE? 如 代码 清单 5-25 所 示 。 

代码 清单 5-25: 假设 不 存在 Rust 的 信用 检 奉 ，compute 国 数 可 能 存 
在 的 问题 


1 fn main() { 

2 let mut 1 = 20; 

3 compute (&1l, &mut i); 
4 } 


在 代码 清早 5-25 中 ， 将 绑 定 i 的 两 种 借用 分 别 当 作 参 数 传 到 compute 
函数 中 ， 假 设 不 考虑 Rust 的 什 用 检查 ， 最 后 输出 的 结 末 是 1， 而 正常 的 
结果 应 该 是 2， 所 以 这 里 出 现 了 问题 。 回 到 代码 清单 5-24 中 查看 compute 
国 数 ， 此 时 传 入 的 input 和 output 都 是 20， 经 过 第 2 行 到 第 4 行 的 it 表达 式 
处 理 后 ，output 的 值 变 为 了 1， 但 是 此 时 input 和 output 其 实 都 是 指 同 同一 
块 内 存 鸭 ， 所 以 当代 码 执行 到 第 5 行 时 ，*#input 盖 5 必然 会 返回 false， 此 
时 疯 数 compute 调 用 完成 ，output 的 值 被 修改 为 了 1。 

但 真实 的 情况 是 ，Rust 必 然 会 进行 信用 检 杏 ， 所 以 代码 清单 5-25 根 
本 不 会 编译 通过 ， 而 会 报错 如 下 : 

error[E0502]: cannot borrow 1 as mutable because it is also borrowed 


as immutable 


这 违反 了 借用 规则 ， 不 可 变 便 用 和 可 变 借用 不 能 同时 和 存在。 对 于 
compute 函 数 ，Rust 编 译 费 知道， 不 会 存在 input 和 output 借 用 目 同 一 个 绑 
定 的 情况 。 所 以 ， 可 以 对 compute 函 数 进 一 步 优 化 ， 如 代码 清单 5-26 所 
不 。 

代码 清单 5-26: 优化 compute 函 数 


fn compute (input: &u32, output: &mut u32) { 
let cached input = *input; 
1f cached input > 10 4 
*output = 2; 
} else if cached input > 5 1 
“output *= 23 
} 


mo HH OG Ws w NN Fe 


} 


9. fn main() { 

Lie let 1 = 20; 

Lis let mut o = 5; 

12. compute (&i, &mut o); // o = 2 
Lex | 


代码 清单 5-26 这 样 的 优化 在 Rust 中 是 非常 合理 的 ， 但 是 在 其 他 语言 
中 不 一 定 合 理 ， 因 为 其 他 语言 没 法 保证 input 和 output 丰 会 来 目 同 一块 内 
和 仓 。 第 2 行 声 明了 cached_input 变 量 绑 定 ， 是 为 了 方便 编译 占 进 一 步 优 
化 ， 因 为 input 是 一 个 不 可 变 借用， 永远 都 不 会 改变 ， 所 以 编译 磊 可 以 
将 它 的 值 体 存在 寄存 项 中 ， 进 一 步 提 升 性 能 。 同 时 ， 通 过 cached_input 
可 以 将 两 个 ff 表达 式 合并 为 一 个 ff else 表 达 式 ， 因 为 大 于 10 的 分 支 永远 都 
不 会 影响 到 大 于 5 的 分 文 。 

忌 的 来 说 ，Rust 的 借用 检查 市 来 了 如 下 好 处 : 

:不 可 变 借 用 保证 了 没有 任何 指针 可 以 修改 值 的 内 存 ， 便 于 将 值 存 
储 在 寄存 器 中 。 

”可 变 估 用 保证 了 在 与 的 时 候 没 有 任何 指针 可 以 谈 取 值 的 内 存 ， 避 
Se, T WERE. 
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进行 目 由 移动 和 重新 排序 。 

关于 引用 ， 还 有 一 个 值得 注意 的 地 方 : 解 引 用 操作 会 获得 所 有 权 
。 在 需要 对 移动 语义 类 型 (例如 &String 类 型 进行 解 引用 操作 时 ， 需 
要 注意 这 一 点 ， 如 代码 清单 5-27 所 示 。 


代码 清单 5-27: 解 引 用 &String 类 型 
thug Eh Jon la: Sprang) ~> Serine 4 


Z let append = *s; 

3 "Hello”.to string() + s&append 
4. } 

S: En maan [i 

or ler x=] LL sto Bring 
Pa join (EX) ; 

8. } 


TEs 5-27'7, joing BSB N&String, A-SI Aaa 
用 。 和 第 2 行 的 let 声 明 中 对 其 进行 解 引 用 操作 ， 编 译 器 直接 报 如 下 错误 : 


error[E0507]: cannot move out of borrowed content 


| let append = *s; 


| NAN 


这 说 明 ， 编 详 希 不 TU EES fer PASH PV DL to a 全 append。 试 想 一 
下 ， 如 琳 s 的 所 有 权 转 移 了， 融会 守 和 化 main 辫 数 中 x 的 所 有 权 做 转移 ， 那 
么 &x 指 加 的 则 是 无 效 地 址 ， 这 就 造成 了 时 指针 IXE Rust P Fe 24 KY E 
的 。 


5.5 生命 周期 参数 


值 的 生命 周期 和 词法 作用 域 有 关 ， 但 古 借用 可 以 在 各 个 函数 间 传 
递 ， 必 然 会 路 越 多 个 词法 作用 域 。 对 于 函数 本 地 声明 的 拥有 所 有 权 的 值 
或 者 借用 来 说 ，Rust 编 译 鼎 包含 的 价 用 检查 占 (borrow checker) 可 以 检 
但 它 们 的 生命 周期 ， 但 是 对 于 跨 词 法 作用 域 的 价 有 用， 借用 检查 右 束 无 法 
目 动 推 半 信用 的 合法 性 了 ， 也 丈 是 说 ， 无 法 判断 这 些 路 词 法 作用 域 的 倍 
用 是 否 满 足 借用 规则 。 不 合法 的 借用 会 产生 巧 王 指针 ， 造 成 内 存 不 安 
人 全。 所 以 ，Rust 必 须 确 体 所 有 的 信用 都 是 有 效 的 ， 不 会 存在 念 焉 指针， 
如 代码 清单 5-28 所 示 。 

代码 清单 5-28: 借用 检查 示例 

Thin fn main() { 


let r? of hp ey 
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在 代码 清单 5-28 中 ， 绑 定 z 将 在 整个 main 函 数 作用 域 中 存活 ， 其 生命 
周期 长 度 用 '′ a 表示; 绑 定 x 存 活 于 第 3 行 到 第 6 行 之 间 的 内 部 词法 作用 
域 中 ， 因 为 它 离 开 内 部 作用 域 束 会 人 波 析 构 ， 其 生命 周期 长 度 用 b 表 
7R, ' b ZWE’ a 小 很 多 。 如 果 该 代码 正常 通过 编译 ， 则 在 运行 时 ， 第 5 
行 代码 就 会 产生 一 个 悬垂 指针 。 幸 运 的 是 ，Rust 编 译 器 不 会 允许 这 种 事 
情 发 生 。 编 译 时 会 借用 检查 占 检 查 代 人 码 中 每 个 引用 的 有 效 性 ， 因 而 代码 
清单 5-28 会 报 以 下 错误 : 


error[E0597]: x% does not live long enough 
> | r= &X; 

| - borrow occurs here 
6 | } 

| ^ x dropped here while still borrowed 
7 | i tes Free Bl 
8 | } 

| - borrowed value needs to live until here 

根据 信用 规则 一 ， 信 用 的 生命 周期 不 能 长 于 出 信 方 的 生命 周期 
在 代码 清单 5-28 中 ， 借 用 &x 要 绑 定 给 变量 r，r 束 成 了 借用 方 ， 其 生命 周 
期 长 度 是 'a， 而 出 借方 是 x， 出 信 方 的 生命 周期 长 度 是 'b， 现 在 a 远 
远大 于 'b， 说 明代 用 的 生命 周期 远 远 大 于 出 借方 的 生命 周期 ， 出 借方 
被 析 构 ， 们 用 还 存在 ， 束 会 造成 营 牌 指针。 由 此 证 明 借 用 无 效 ， 俩 用 检 
但 无 法 通过 ， 编 详 天 报错 ， 成 功 地 阻止 了 和 巧 王 指针 的 产生 。 

如 各 只 是 在 函数 本 地 使 用 信用 ， 那 么 信用 检 碍 画 很 容易 推导 其 生命 
周期 ， 因 为 此 时 Rust 拥 有 天 于 此 函数 的 所 有 人 信息。 一旦 跨 函 数 使 用 从 
用 ， 比 如 作为 疯 数 参数 或 返回 值 使 用 ， 编 详 融 束 无 法 进行 检查 ， 因 为 编 
详 苍 无 法 判断 出 所 有 的 传 入 或 传 出 的 信用 生命 周期 范围 ， 此 时 需要 蛇 陈 
地 对 信用 参数 或 返回 信使 用 生命 周期 参数 进行 标注 。 


5.5.1 显 式 生 命 周期 参数 


生命 周期 参数 必须 以 单 引 号 开头 ， 参 数 名 通 第 都 是 小 与 字母 ， 比 如 
"a 。 生 命 周 期 参数 位 于 引用 符 亏 区 后 面 ， 并 使 用 空格 来 分 割 生 命 周 期 
参数 和 类 型 ， 如 下 上 所 示 。 

他 六 // SIA 
&"a i32; // ”标注 生命 周期 参数 的 引用 
&'a mut i32; // 标注 生命 周期 参数 的 可 变 引 用 

标注 生命 周期 参数 并 不 能 改变 任何 引用 的 生命 周期 长 短 ， 它 只 用 
于 编 详 需 的 借用 检 栓 ， 来 防止 仿生 指针 。 

国 数 签名 中 的 生命 周期 参数 

国 数 位 名 中 的 生命 周期 参数 使 用 如 下 标注 语法 : 


To TOOG =a Ser, Et p'a Seri = &€'s Ser: 


图 数 名 后 面 的 本 a> 为 生命 周期 参数 的 声明 ， 与 泛 型 参数 类似， 
必须 先 声 明 才 能 使 用 。 函 数 或 方法 参数 的 生命 周期 叫 作 输入 生命 周期 
(input lifetime ) ， 而 返回 值 的 生命 周期 被 称 为 输出 生命 周期 Coutput 
lifetime ) 。 

疯 数 签名 的 生命 周期 参数 有 这 样 的 限制 条 件 : 输出 (借用 方 ) 的 生 
命 周 期 长 度 必须 不 长 于 输入 《出 借方 的 生命 周期 长 度 〈( 此 条 件 依然 带 
循 信 用 规则 一 ) 。 

Fb, WAR, ZEEAAS TOL PRESH ， 
AVA HA me aie BY ESE, QRS 5-29 .- 

代码 清单 5-29: 无 输入 参数 日 返回 引用 的 函数 


l; £A féturi Strs asl) => G'a str | 

A Let mut s = "Rust rto strings) F 

3. tor 2 In Wns | 

4. s.push str("Good "); 

5. } 

6. ES Lux] //"“Rust Good Good Good" 

Ts } 

8. fn main() { 

9. Let x = return strii; 

10. } 

代码 清单 5-29 编 详 会 报 如 下 错误 : 
error[E0597]: s does not live long enough 
6 | Selec] //“Rust Good Good Good" 


| “ does not live long enough 
fe 


| - borrowed value only lives until here 


前 误 消 息 显示 ， 绑 定 s 存 活 时 间 不 够 长 ， 在 离开 returmn_str 函 数 时 就 
会 被 析 构 ， 而 该 函数 还 要 返回 绑 定 s 的 借用 &s[.]， 这 明显 违反 了 借用 
规则 一 ， 制 造 了 悬垂 指 针 ， 这 是 Rust 绝对 不 允许 的 行为 。 所 以 ， 如 果 
想 修正 此 代码 ， 可 以 返回 一 个 String 类 型 。 


从 函数 中 返回 (输出 ) 一 个 引用 ， 其 生命 周期 参数 必须 与 函数 的 
参数 〈 输 入 ) 相 匹 配 ， 和 否则 ， 标 注 生 命 周期 参数 也 毫 无 意义 ， 如 代码 
清单 5-30 所 示 。 


代码 清单 5-30: foo 函 数 的 引用 参数 和 返回 的 引用 生命 周期 曼 无 关 


SÈ 


rn, TOOS aP; a SEE; VE o'a SEE) -> GS STEE i 
let result = String::from("really long string"); 
// error[E0597]: `result` does not live long enough 
FesuUlTsae SCE C) 
} 
fn main() { 
let x = "hello"; 
let y = "rust"; 
LOO (x, Yi 


= tO OT oF OF kt WN Ff 


Ow + 

代码 清 单 5-30 编 译 会 报错 ， 错 误 消 居 为 第 3 行 注释 的 内 容 。 此 时 编 
译 堪 拥有 对 函数 foo 的 全 部 信息 ， 生 命 周期 标注 完全 没有 派 上 用 场 ， 所 
以 生命 周期 标注 在 此 处 是 多 余 的 。 

下 面 来 看 一 个 正常 需要 进行 生命 周期 参数 标注 的 示例 ， 如 代码 清早 
5-31 所 示 的 情况 。 
代码 清单 5-31: 需要 进行 生命 周期 标注 的 示例 


1 ii. the LOnGgest (sii ESET, 321 Ste) -> etry | 
2 tE gi.bem() > o2eleni; { BL } else { sz | 
3 } 

4 fn main() { 

ae let Sl. = String? :from("Rust”) 4 

6 Lee gL r = $613 

7 { 

8 ler BZ = DLELDNGIRSI cron" o") 3 

>a lert Tes = the Lengesti(sl FE, 8827} 

LO, printini ("{} 2s the longest”, Tes) 

ii } 


lés J 


编译 代码 清单 5-31 会 报 以 下 错误 : 
error[E0106]: missing lifetime specifier 
| in the longestisie gtr, S2; Gata) -> &str | 
| ^ expected lifetime parameter 


编译 器 要 求 标 注 生 命 周期 参数 ， 此 时 编译 器 已 经 无 法 推导 出 返回 的 
借用 是 否 合法 ， 代 码 清单 5-32 为 标注 了 生命 周期 参数 的 代码 。 


代码 清单 5-32: 为 the_longest 疯 数 标注 生命 周期 参数 


Le te Tie LOngesi< See (SLs ga SE, Sdt & a She) -> a BCE 4 
Ba tE sl,len() > sz2.len() { sl f else { BZ 

Jas | 

4, fn main() { 

Dn Lat s1 = Bring? irom RISC!) + 

6 Lee si T = Goli 

Ta { 

0 lert BZ = Strings: Trom("c")? 

Bs bet Fes = the longest(sl BT, 682); 

LO y println! ("{} is the longest", res); // Rust is the longest 
ie } 

LZ: J 


代码 清单 5-32 中 the_longest 函 数 签 名 标注 了 生命 周期 参数 。 其 中 < 
′a>> 和 是 对 生命 周期 参数 的 声明 ， 两 个 输入 参数 和 返回 参数 都 加 上 了 生 
变 为 & astr -o KUSHEA” a 可 以 看 作 一 个 生命 周期 
型 参数 ， 输 入 引用 和 输出 引用 都 标记 为 'a ， 意 味 关 输出 引用 借用 
on) Eb 周期 不 长 于 输入 引用 《出 借方 的 生命 周期 。 


再 来 看 main 水 数 ， 当 the_longest 浮 数 被 实际 调用 时 ， 借 用 检查 如 会 
Nea PA 数 签 名 时 的 生命 周期 参数 标记 的 具体 情况 进行 检查 ， 如 图 5-5 所 
示 。 


the Longest(sl rs &s2); 


| 


't 


生 苗 周期 长 度 


main scope 


inner scope 





图 5-5: 函数 调用 借用 检查 示意 图 

the_longest 疯 数 的 第 一 个 参数 是 sl1_r， 它 的 实际 生命 周期 是 从 代码 
清单 5-32 的 第 6 行 到 第 12 行 ， 我 们 将 其 命名 为 ” s1， 那 么 可 以 说 ， 
the longest A AZA PRESA a 在 调用 时 和 被单 态 化 为 了 s1 o m 
议 图 数 的 第 二 个 参数 &s2 的 生命 周期 是 从 代码 清单 5-32 的 第 7 行 到 第 10 
行 ， 我 们 将 其 命名 为 ”s2 。 同 理 ， 可 以 说 ， 泛 型 参数 ” a 在 此 时 被 单 态 
WAS! s2. 

the_longest (s1_r, &s2) 返回 引用 的 生命 周期 记 为 " t 。 第 9 行 的 let 
声明 了 绑 定 res， 其 生命 周期 记 为 " rr 。 因 为 res 绑 定 了 the_longest 函数 
返回 的 全 有 用， 本质 上 只 是 引用 的 按 位 复制 ， 所 以 res 成 为 了 信用 方 ， 其 生 
命 周 期 长 度 为 " Fr ， 且 等 于 t 。 经 过 以 上 分 析 ， 信 用 方 的 生命 周期 长 
度 不 长 于 出 借方 的 生命 周期 长 度 ， 不 会 造成 念 牌 指针 ， 所 以 信用 生效 ， 
ry EE is E. 

其 实 对 于 多 个 输入 参数 的 情况 ， 也 可 以 标注 不 同 的 生命 周期 参数 ， 
如 代码 清单 5-33 所 示 。 


WSIS 45-33: 标注 多 个 生命 周期 参数 


lL. En the longést<'a, *b>(sls fa str, S52: bb str) => &'a Str | 


2 if sl.len() > s2.len() { sl } else { s2 } 
3. | 
编译 代码 清单 5-33， 编 译 器 会 报错 : 
error[E0312]: lifetime of reference outlives lifetime of borrowed 
CORURRE. « s 


这 古 因为 编 详 器 无 法 判断 这 两 个 生命 周期 参数 的 大 小 ， 此 时 可 以 显 
却 地 指定 ”a 和 ”b 的 关系 ， 如 代码 请 单 5-34 所 示 。 

代码 清单 5-34: 指定 生命 周期 参数 之 间 的 大 小 天 系 
l. in the longest<"a, "Di ‘a>(sl: &'a Str, 52: &"b Str) => &'a str { 
Lu if sl.len() > s2.len() { sl } else { s2 } 

Sx j 

在 代码 清单 534 中 ，'′b: ' a 的 意思 是 泛 型 生命 周期 参数 ，b 的 存 
活 时 间 长 于 泛 型 生命 周期 参数 ”a CH’ b outlive' a ) 。 如 果 用 集合 3 
WH, Mi b AG’ a, BW’ a Æ' b 的 子 集 。 但 是 通过 上 面 的 分 
HT, main 函数 中 传 入 的 参数 slr 的 生命 周期 却 长 于 &s2 的 生命 周期 ， 
对 应 全 jthe_longest 疯 数 参 数 中 ， 束 是 s1 的 存活 时 间 长 于 s2 的 ， 和 而 s1 的 生 
命 周 期 是 'a ，s2 的 生命 周期 是 ' b ， 从 直觉 上 来 看 ， 明 显 是 'a 的 存 
活 时 间 长 于 ”bb 的 ， 但 为 什么 现在 'b: ' a 表示 上 b 的 存活 时 间 长 于 
a 的 呢 ? 

不 要 起 记 生命 周期 参数 的 日 的 是 什么 。 和 生命 周期 参数 是 为 了 帮助 
合用 检查 右 验 证 非法 佰 用 。 孙 数 间 传 入 和 返回 的 便 用 必须 相关 联 ， 并 
且 返 回 的 信用 生命 周期 必须 比 出 信 方 的 生命 周期 长 。 所 以 ， 这 里 ′b: 
"aay! atik eS H (aA) 的 生命 周期 ， 必 须 不 能 长 于 ”b〈 出 
首 方 》 的 生命 周期 。 

the_longest 国 数 在 调用 时 ， 其 参数 的 泛 型 生命 周期 参数 " a A'b 
会 单 态 化 为 具体 的 生命 周期 参数 ' sl 和 s2 ， 其 返回 引用 的 泛 型 生命 
周期 参数 a 也 会 单 态 化 为 " t ， 因 为 res 绑 定 了 该 函数 返回 的 引用 ， 上 所 
以 rr 和 ”tt 十 等 价 的 。Rust 里 let 绑 定 的 声明 顺序 正好 和 析 构 顺序 相反 ， 
这 是 由 栈 结构 的 后 进 先 出 特性 决定 的 。 所 以 ，res、&&s2 和 sl1_r 的 析 构 顺 


序 是 res 最 先 ， 然 后 是 &s2， 最 后 是 sl_r。 在 res 析 构 之 前 ，&s2 必须 存 
wW CURS EREE, EKANDE, XE Rust 绝对 不 允许 
的 。res 的 生命 周期 参数 是 ' r, &s2 的 生命 周期 参数 是 's2 ， 它 们 的 
关系 是 s2: ' r, S2 的 存活 时 间 长 于 ro i’ s2 M’ r 分 别 对 应 
其 函数 签名 中 的 生命 周期 泛 型 参数 ' b 和 ”a ， 所 以 得 出 ' b: a。 而 
对 于 参数 sS1_r 来 说 ， 其 生命 周期 参数 ′ sl 对 应 生命 周期 泛 型 参数 ” a ， 
本 身 ' sl 和 rr 的 关系 就 是 sl: r, REWE’ a: ' a， 如 图 5-6 所 
示 。 


let res = the longest(sl r, &s2); 


| 


t 


命 周 期 参数 


析 构 顺序 从 左 到 右 





图 5-6: the_longest 函 数 调 用 时 生命 周期 分 析 示 意图 

鲜 数 釜 名 中 多 个 生命 周期 参数 的 天 系 看 上 去 比较 复杂 ， 但 是 只 要 把 
握 一 个 原则 残 可 以 理解 它 : 生命 周期 参数 的 目的 是 帮助 借用 检查 占 验 
证 合法 的 引用 ， 消 除 惹 王 指 针 。 在 Rust 官 方 文档 中 提 到 ， 这 种 生命 周 
期 参数 包含 关系 是 一 种 子 类 型 ， 并 有 日 用 &”a str#l&’ static str 两 种 类 型 
做 了 示例 ， 对 于 所 有 人 允许 使 用 & a str 类 型 的 地 方 ， 使 用 & static str 
是 合法 的 。 但 实际 上 ，Rust 中 的 生命 周期 参数 并 非 类 型 ，&′ static str 也 
只 是 Rust 中 少 有 的 特例 。 也 有 人 按 集 合 论 总 结 出 了 判断 生命 周期 参数 的 
所 谓 公 式 ， 但 即使 使 用 公式 ， 也 一 定 要 搞 恒 生命 周期 参数 背后 的 意义 。 

结构 体 定义 中 的 生命 周期 参数 

除了 函数 签名 ， 结 构 体 在 含有 引用 类 型 成 员 的 时 候 也 需要 标注 生命 


周期 参数 ， 否 则 编译 器 会 报错 : missing lifetime specifier。 代 码 清单 5-35 
是 一 个 包含 引用 类 型 成 员 的 结构 体 示 例 。 代 人 码 清 单 5-35: 包含 引用 类 型 
成 员 的 结构 体 也 需要 标注 生命 周期 参数 


Struct ROG AD 4 

2 partys t'a etr, 

3e ] 

4 fn main() { 

5 let words = String::from("Sometimes think, the greatest sorrow than 
older") ; 

Os let first = words.split(',').next().expect("Could not find a 
Pe 

is let f = Foo { part: first }; 

oa assert eq: ("Sometimes think", f£,.part) ; 

9, J 


在 代码 清单 5-35 中 ， 结 构 体 Foo 有 一 个 成 员 为 &str 关 型 ， 必 须 先 声明 
生命 周期 泛 型 参数 生 ”a> ， 才 能 为 成 员 part 标 注 生 命 周 期 参数 ， 变 为 & 
”astr 关 型 。 这 里 的 生命 周期 参数 标记 ， 实 际 上 是 和 编译 需 约 定 了 一 个 
规则 : 结构 体 实 例 的 生命 周期 应 短 于 或 等 于 任意 一 个 成 员 的 生命 周 
期 。 

main 也 数 中 声明 了 一 个 String 类 型 的 字符 串 words， 然 后 使 用 split 
方法 按 远 号 规则 将 words 进 行 分 制 ， 再 通过 next 方 法 和 expect 方 法 返回 一 
个 字 从 串 切片 first。 其 中 next 方 法 为 从 代 右 相 关 的 内 容 ， 第 6 章 会 讲 到 。 

在 代码 第 7 行 ， 用 first 实 例 化 结构 体 Foo。 此 时 ， 编 诺 右 项 会 根据 该 
结构 体 事先 定义 的 生命 周期 规则 对 其 成 员 part 的 生命 周期 长 度 进 行 检 
查 。 当 前 part 的 生命 周期 是 整个 main 函 数 ， 而 Foo 结 构 体 实例 {f 的 生命 周 
期 确实 小 于 其 成 员 part 的 生命 周期 ，f 会 在 first 之 前 被 析 构 。 否 则 ， 如 果 
first 先 被 析 构 ，fpart 了 驶 会 成 为 合算 指针 ， 这 是 Rust 绝 对 不 允许 的 。 

方法 定义 中 的 生命 周期 参数 

假如 为 结构 体 Foo 实 现 方法 《如 代码 清单 5-36 所 示 ) ， 因 为 其 包含 
引用 类 型 成 员 ， 标 注 了 生命 周期 参数 ， 所 以 需要 在 impl 关 键 字 之 后 声明 
生命 周期 参数 ， 并 在 结构 体 Foo 名 称 之 后 使 用 ， 这 与 泛 型 参数 是 相似 
的 。 


代码 消 里 5-36: 为 结构 体 Foo 实 现 方法 
1.#[derive(Debug) | 


in Semier Foes Bs + 

Ja pare? dC ser, 

4. 3} 

D> IMRI! FO "D> { 

0. oa Splat TLESGLISS SB eli) -7 GJA SEE 4 

‘a 5 eplit (",*) ext () expect ("Could not Eand a *,*™) 
one } 

Dis fn new(s: &'a str) -> Self i 

LD Hoo (Part: Hoc ssplit, Biever ce) } 

abs } 

leu i 

Los LA Met) 4 

14. let words = String::from( 

LB e "Sometimes think, the greatest sorrow than older"); 
| ce printin? ("Lif ",2OOs new (wordsudas Str()))F 

1 ie at 


Foo 结 构 体 中 实现 了 两 个 方法 ，new 和 first， 其 中 first 是 在 new 内 部 调 
用 的 ， 这 两 个 方法 签名 中 使 用 的 生命 周期 参数 a 是 在 impl 关 键 字 后 面 
定义 的 ， 在 整个 impl 块 中 和 运用。 

如 采 new 和 first 方 法 签名 中 不 添加 生命 周期 参数 ， 则 会 报 钳 : 

error[E0495]: cannot infer an appropriate lifetime for lifetime parameter 


in function call due to conflicting requirements 

Xe ALA a PE as TATE MTS oP S| AAA a ed CEASE ta Jd BH 
参数 ' a Lia, APR SAS) AZ oi Jal IR Re BER FY 28 4 (FOO fil 
的 生命 周期 长 度 。 

妨 外 ， 枚 举 体 和 结构 体 对 生命 周期 参数 的 处 理 方 式 是 一 样 的 。 

前 仿生 命 周 期 参数 

Rust 内 置 了 一 种 特殊 的 生命 周期 ”static ， 叫 作 静 态 生 命 周 期 o 
static 生命 周期 存活 于 整个 程序 运行 期 间 。 所 有 的 字符 串 字 耐量 部 有 
static 生命 周期 ， 类 型 为 &′static str ， 请 思考 代码 清单 5-37。 


代码 清单 5-37: FITE FEE a Fd h 


1 fn main() { 

> let x = “hello Rust"; 
J. let y = x; 

z assert 6G! (2; yY)? 

3 } 


在 代码 清单 5-37 中 ， 字 符 串 字面 量 x 执行 y=x 赋 值 操作 之 后 ，x 继 续 
可 用 ， 说 明 此 处 赋值 执行 的 是 按 位 复制 ， 而 非 移动 语义 。 

字符 串 字 面 量 是 全 局 静态 类 型 ， 它 的 数据 和 程序 代码 一 起 存储 于 可 
执行 文件 的 数据 段 中 ， 其 地 址 在 编译 期 是 已 知 的 ， 并 且 是 只 读 的 ， 无 法 
更 改 ， 可 执行 文件 的 组 成 结构 如 图 5-7 所 示 。 


可 执行 文件 组 成 结构 虚拟 内 存 空间 


RO data 
只 读数 据 段 


RW data 
读 与 数据 段 





图 5-7: 可 执行 文件 组 成 示意 图 
所 以 ， 代 码 清单 5-37 中 的 静态 字符 串 x 按 位 复制 的 仅仅 是 存 储 于 栈 
上 的 地 址 ， 因 为 数据 段 是 只 读 的 ， 并 不 会 出 现 什 么 内 存 不 安全 的 问题 。 
另外 值得 一 提 的 是 ， 在 Rust ” ”2018 版 本 中 ， 使 用 const 和 static 定 义 字 
APRS, Aha ati’ static 静态 生命 周期 参数 。 


5.5.2 省 略 生 命 周 期 参数 


XY THEW E is BE ie SO EE a Fe PT, SE AEE 
AY URRE as Jed FE AY BE, SS HS -38 AT 
代 公 清单 5-38: 省 略 生 命 周 期 参数 的 示例 


1 in, fifSt_word(s: &Str) => ESEE { 

2 iet bytes = s.as bytes () 7 

3 for (i, &item) in bytes.iter().enumerate() { 
4 if item == b' ' { 

sA return £8 [0. 2]? 

6 } 

7 } 

8 &S[..] 

9 } 

10. En, maam¢) { 

Dl PrEInCLAL L" L: Tirst. word(™helle Rust”) ls 


12. 4 
AAS es 5-38 76 P] VUE Se PEI). eR) BC first_wordH) Dy He ENG Te 
入 的 &str 交 型 字符 串通 过 as_bytes 方 法 转换 成 字 节 序列 。 然 后 再 通过 for 
循环 找到 空格 ， 并 返回 空格 前 的 所 有 了 字符 组 成 的 字符 串 切 厂 &s[0..i]。 其 
中 第 3 行 for 循 环 迭 代 左 中 链 式 调用 最 后 的 enumerate 方 法 返回 的 是 字 贡 订 
列 下 标 和 元 素 的 引用 ，for 循环 中 的 &item 是 利用 模式 匹配 来 获取 item 
的 ， 这 样 束 可 以 在 第 4 行 参 与 比较 操作 。 最 后 ， 如 果 没 有 找到 空格 ， 则 
返回 整个 字符 串 。 该 图 数 的 输入 参数 和 返回 值 都 属于 引用 ， 为 什么 不 需 
要 标注 生命 周期 参数 ? 当然 ， 如 果 投 生命 周期 参数 规则 进行 标注 ， 诠 代 
£5, 2 E I a 
XÆ A Rust XY) He Ey se AE SL ek, RE 2] 
Rustia P, Damas 8) LL A oy thot eh Be h E ain Jie] HH Bi, 
IPE E KE m A FSB. VME Sy Ht ag Ea AZ ain ed A 
省 略 规 则 (Lifetime Elision Rule) ， 一 共 包 含 三 条 规则 : 
每 个 输入 位 置 上 管 略 的 生命 周期 都 将 成 为 一 个 不 同 的 生命 周期 参 
数 。 
GR RA aA re A ON SEB A), WA 
周期 都 将 分 配给 输出 生命 周期 。 


: 如 果 存 在 多 个 输入 生命 周期 的 位 置 ， 但 是 其 中 包含 看 &self 或 &mut 
self， 则 self 的 生命 周期 都 将 分 配给 输出 生命 周期 。 

如 果 不 满足 上 和 面 三 条 规则 ， 省 略 生 命 周 期 将 会 出 错 。 代 码 清早 5-39 
罗列 了 一 些 省 略 或 非法 的 示例 。 

代码 清单 5-39: 各 类 函数 签名 生命 周期 省 略 或 韭 法 示例 


L. 8 print(ss We; // H% 
2 tm primpe'aeis: k'e strl; // EN 
3. tn, debug tll Tont, St Cates // B® 
4. <n debugs'a>(lvlé uint, BY G'A Str); // 展开 
5. fn substri(s: str, until: uint) -> stri // HA 
6, fn BUS DT uinti => k'a str: // 展开 
7. fn get str() -> é&str; // 非法 
S. fn Brobies str, Ci So) -> Sete // ABR 
9. fn get mut (&mut self) -> &mut T; // A% 
10. fn get mut<'a>(&'a mut self) -> &'a mut T; // 展开 

11. // 4% 


L2. in args<l:ToCstr> (nt self, args: &[T|) > émut Command 
13. ff Ber 
La. In Broek’ dy “Dy TETOGs re iS a MUL Sali, eras: £'b ITI -Ti 


Command 
15. fn new(buf: &mut [u8]) -> BufWriter; // 省 略 
16. fn new<'’a>(buf: &'a mut [u8]) -> BufWriter<'a> // 展开 


我 们 从 代码 清单 5-39 PHL AEA, Na PETE 
满足 生命 周期 省 略 规则 。 

第 1 行 ， 只 有 一 个 引用 类 型 的 参数 ， 满 中 第 二 条 规则 ， 虽 然 没有 返 
器 值 ， 但 是 可 以 推断 出 引用 的 生命 周期 。 

第 7 行 ， 没 有 任何 参数 ， 不 满足 任何 一 条 规则 ， 上 所 以 推 采 出 钳 。 

第 8 行 ， 两 个 引用 参数 ， 也 融 是 拥有 两 个 生命 周期 参数 的 位 置 ， 分 
别 补 齐 两 个 不 同 的 生命 周期 参数 ， 满 足 第 一 条 规则 ， 但 是 不 满足 态 外 两 
条 规则 ， 也 不 存在 其 他 规则 来 带 助 编 详 硕 推 产生 命 周 期 ， 所 以 这 里 推 其 
出 钳 ， 还 需要 显 式 地 指定 生命 周期 参数 。 

第 12 行 ， 两 个 引用 参数 代表 两 个 生命 周期 参数 的 位 置 ， 但 是 其 中 


之 一 是 &mut self, WERZA, IRIS) ARAYA fia HAS fa self 


的 生命 


周期 。 所 以 此 处 可 以 符 略 生命 周期 。 
现在 ， 了 解 了 管 略 生命 周期 规划 以 后 ， 我 们 再 为 代码 清单 5-36 添 加 


一 个 新 的 方法 ， 如 代码 清单 5-40 所 示 。 


O: QO =m O G S e a e 


T a A ES a a a a 
~- oT oF e Ga a — a a 


N e e 
Ss ee a 


代码 清 单 5-40: Asis 425-36) Dot A 77 YEget_part 
# [derive (Debug) ] 
struct Foox'a> 4 
parti é a Ser; 
} 
impl<"a> Fod<'a> f 
fn split Firetles &'a str) -> k'a str | 
s,split(',')snext() expect ("Could not find a "vy" 
fn new(s: &'a str) -> Self { 
Foo {parte Poorysplit. firsts) } 
rh get. part SSS -> BLE 4 
self.part 


el 


e Eh mali) i 


let words = String::from("Sometimes think, the greatest sorrow than 
older"); 
let foo = Foor:rew (Wordsas str()); 


DEINEAL Li pTO ger Part ()) 


T 


在 代码 清单 5-40 中 ， 为 结构 体 Foo 洪 加 了 新 的 方法 


get_part (&self) ， 其 参数 为 &self， 代 表 一 个 实例 方法 ， 此 处 满足 生命 
周期 省 略 规 则 ， 所 以 并 没有 添加 显 式 的 生命 周期 参数 。 


5.5.3 生命 周期 限定 
生命 周期 参数 可 以 像 trait 那 样 作 为 泛 型 的 限定 ， 有 以 下 两 种 形式 。 


IT: ”aa， 表 示 I 类 型 中 的 任何 引用 都 要 “ 活 得 ?和 a 一 样 长 。 

- T: Traitt’ a ， 表 示 T 类 型 必须 实现 Trait 这 个 trait， 并 且 工 类 型 中 
任何 引用 都 要 “ 活 得 ?和 ”′a 一 样 长 。 

代码 清单 5-41 展 示 了 生命 周期 限定 的 示例 。 

代码 清单 5-41: 生命 周期 限定 示例 


| 
16. 
1 2 
18. 
19. 
20, 
ALa 


use std::fmt::Debug; 
# [derive (Debug) ] 
struct Rer<s'ar Te "aae a DN: 
C HeLa tre T) 
where 
T: Debug, 


BElNE LDL I” OLDE E IS Li Pe T 
} 
[En Print ref<s'e; T(t G'a T) 
where 

Te Debug t ‘a, 


printiat (" print reft y Gas (27)"* El? 
} 
fn main() { 

let x = 7; 

Let fet x = Ree (ix)? 

Print Ferlerer we 

print (ref x); 


} 


代码 清单 5-41 中 定义 了 一 个 元 组 结构 体 Ref， 用 于 保存 汉 型 类 型 工 的 
引用 ， 但 是 却 不 知道 该 引用 类 型 的 生命 周期 。 工 可 以 是 任何 引用 ， 这 里 
MEAT: ' a 来 对 类 型 TT 进行 生命 周期 限定 ， 将 它 的 生命 周期 约束 为 和 ' 
a 的 一 样 长 。 此 外 ，Ref 的 生命 周期 长 度 也 不 会 超过 ”a 的 。 然 后 定义 两 
个 泛 型 函数 print 和 print_ref 来 分 别 打 印 值 类 型 和 引用 类 型 ，print_ref 测 数 
位 名 同样 使 用 了 生命 周期 限定 。 


对 于 引用 类 型 &T 来 说 ， 可 以 最 式 地 使 用 生命 周期 限定 来 约束 其 和 后 
命 周 期 。 但 是 对 于 没有 引用 的 泛 型 类 型 T 来 说 ， 可 以 看 作 使 用 静态 生命 
周期 作为 限定 ， 形 如 T: ”static  ， 因 为 引用 的 生命 周期 只 可 能 是 藻 时 
HJ, MJE’ static 的 。 程序 中 一 旦 出 现 了 ”static ， 束 代表 其 生命 周期 
与 硬 编 码 (Hardcode) 的 生命 周期 一 样 长 久 。 

在 Rust 2018 版 本 中 ， 像 代码 清单 5-41 中 结构 体 的 下 a 限定 可 以 
省 略 ， 编 译 亏 将 对 此 实现 目 动 推 鄙 。 


5.5.4 trait 对 象 的 生命 周期 


如 果 一 个 trait 对 象 中 实现 trait 的 次 型 市 有 生命 周期 参数 ， 访 如 何 处 
JE? 如 代码 清单 5-42 所 示 。 
代码 清单 5-42:， trait 对 象 中 实现 trait 的 类 型 市 有 生命 周期 参数 


ila traLrt Foo {} 

Za Struct Barx"*s> 4 

3. ee p'a 152, 

4. } 

an iml<'a> Foo fór Bar<"*a> {} 

ae fn main() { 

T, let num = 5; 

8. let box bar = BOX! smew (Bar { x? nim }); 
9, let obj = box bar as Box<Foo>; 

Loe F 


代码 清单 5-42 定义 了 市 生命 周期 参数 的 结构 体 Bar， 并 实现 了 trait 
Foo. 2 8 行使 用 Box: : new 装 箱 了 结构 体 Bar 的 实例 ， 并 在 第 9 行将 其 
转换 为 trait 对 象 Box 二 F000 这 >。 该 代码 编译 能 够 正常 明 过 。 

这 是 因为 trait 对 象 和 生命 周期 有 默认 巡 循 的 规则 : 

:trait 对 象 的 生命 周期 默认 是 ”static。 

: 如 果实 现 trait 的 类 型 包含 &' a X M&’ amutX， 则 默认 生命 周期 
PE de 

:如果 实现 trait 的 类 型 只 有 T: ' a， 则 默认 生命 周期 就 是 ′ a。 

如 果实 现 trait 的 类 型 包含 多 个 类 似 T: “a 的 从 名 ， 则 生命 周期 二 


要 明确 指定 《如 代码 清单 5-43 所 示 ) 。 
代码 清单 5-43: 需要 明确 指定 trait 对 象 生 命 周 期 的 示例 


1. trait Foo<*a> {} 


fas struct Fooimpl<"a> 1 

3: ar p'a Daal; 

4. } 

a impl<"a> Foo<"a> for Foolmpl<'a> { 

6. } 

vi tn Teoma (ss c'a Ws2z]) => BOSS roos" Aa 4 
8. Box::new(FooImpl { s: s }) 

9. } 


10. fn main () {} 

Mis 5-43 编 详 会 出 错 ， 因 为 编译 鼎 无 法 推断 生命 周期 。Box 一 
Foo<! a>>ve—* trait 对 象 ， 它 的 默认 生命 周期 是 ′static 的 。 而 现在 
实现 trait Foo 的 类 型 FooImpl 有 一 个 & ”a [u32] 类 型 的 成 员 ， 所 以 此 时 的 
trait ”对 象 生 命 周 期 应 该 是 ' a。 因 此 ， 如 果 想 修复 上 面 的 错误 ， 只 需要 
显 式 地 为 trait 对 象 增 加 生命 周期 参数 ， 将 Box<Foo<'′ a> > 改 为 Box<< 
Foo<’ a>+’' a> 即 可 ， 此 时 该 trait 对 象 的 生命 周期 就 是 a, Feu RR 
AHI’ static y J HH. 


5.6 i feta FS ATA A 


BR MEA SIA CAF) 类 型 ，Rust 还 提供 具有 移动 语义 〈 引 用 语 
MO) 的 智能 指针 。 智 能 指针 和 普通 引用 的 区 别 之 一 就 是 所 有 权 的 不 同 。 
智能 指针 拥有 资源 的 所 有 权 ， 而 普通 引用 只 是 对 所 有 权 的 借用 。 

代码 清单 5-44 展 示 了 智能 指针 独占 所 有 权 的 一 个 示例 。 

代码 清单 5-44: 智能 指 时 Box< 工 > 独占 所 有 权 


La Sn Maim{) 4 

2 let x = Box: :new("hello") ; 

ce let y = x; 

4 . // error[E0382]: use of moved value: x 
cB iF BEAM A! (TI se): 


a 4 
TESS 5-44, RWE x SEAM RBA Ey. Box<T> 
能 指针 也 可 以 使 用 解 引 用 操作 符 进 行 解 引用 ， 如 代码 清单 5-45 所 示 。 
代码 清单 5-45: 解 引 用 智能 指针 Box 二 TT 


Le £n Marimi) 

A let a = Box: :new("hello"); 

ce let D = Bexmigner(".RUSt ste Strings) iF 

4. let c = *a; 

i. let d = *b; 

oe prinrtinii i:a"; eps 

ts // error[E0382]: use of moved value: ‘b> 
Bos ff BINT E" t2 "p B3 


9. } 
代码 清 单 5-45 声 明了 两 个 变量 绑 定 a 和 b， 分 别 装 箱 了 字符 串 字 耐量 
和 String 类 型 。 对 a 和 b 分 别 进 行 解 引 用 以 后 ，a 可 以 继续 访问 ，b 则 不 
行 。 这 是 因为 a 装 箱 的 字符 串 字 耐量 进行 了 按 位 复制 ， 而 b 装 箱 的 String 
类 型 是 引用 语义 ， 必 须 转移 所 有 权 。 
之 所 可 以 解 引 用 ， 是 因为 Box<TI > 实现 了 deref 方 法 。 代 人 码 清 单 5-46 
展示 了 Box<T > 实现 deref 的 源码 。 


代码 清单 5-46: Box<T>Xideref FAM YHA 
1 impl<T: ?Sized> Deref for Box<T> | 
2 type Target = T; 

3 fn deref(&self) -> &T { 

4. &**self 
2 

6 


. } 

看 得 出 来 ， 此 deref 方 法 返回 的 是 &T 类 型 。 这 里 没有 添加 生命 周期 
参数 是 因为 满足 生命 周期 省 略 规则 。 但 是 在 代码 清单 5-45 中 ， 解 引用 a 
和 b 得 到 的 都 是 值 类 型 ， 而 非 引用 类 型 &T。 实 际 上 ， 这 里 的 *a 和 *b 操 
作 相 当 于 * Ca.deref) 和 * Cb.deref) 操作 。 对 于 Box< 工 > 类 型 来 说 ， 如 
打包 含有 的 类 型 T 属 于 复制 语义 ， 则 执行 按 位 复制 ， 如 来 属于 移动 语 
义 ， 则 移动 所 有 权 。 所 以 代码 清单 5-45 中 b 的 所 有 权 被 转移 了 。 

这 种 对 Box<T > 使 用 操作 符 CO 进行 解 引用 而 转移 所 有 权 的 行 
为 ， 航 称 为 解 引 用 移动 ， 理 论 上 应 该 使 用 trait DerefMove 定 义 此 行为 ， 
这 也 是 官方 团队 未 来 打算 做 的 ， 但 实际 上 Rust 源 码 中 并 不 存在 此 trait。 
目前 文 持 此 行为 的 昼 能 指针 只 有 Box 雪 工 > 。 

如 代码 清单 5-47 所 示 ，Rc<T> 或 Arc<T> 智 能 指针 不 支持 解 引用 
移动 。 

代码 清单 5-47: Re<T> FlAre<T> pA ME) 

le uge SUHli re: sae 
Ze Use Stdsrssynes:Arc; 
3 fn main() { 
4 Let r = BRepinew ("Rust"’.te stringi) ly 
E let a = Arc::new(vec![1.0, 2.0, 301): 
Bs // error[E0507]: cannot move out of borrowed content 
7 i let z = Yf} 
8 if printlin!i ose)". rj: 
3 // error[E0507]: cannot move out of borrowed content 
Ls // let £ = *foo; 


Xe ABox<T> AH T HAEA Beta TOR BORA, SR AAS - 


48 来 自 Box<T> 的 源码 实现 。 
代码 清单 5-48: Box< 工 > 的 原 码 实现 
io # [lang = "owned box"] 
2. pub struct Box<T: ?Sized>(Unique<T>) ; 


Box 二 I 二 标注 J]Lang Item" owned_box" , mi% 4s FA UCR J] 
Box<T> KRH, AVABox<T> SIREREA I, FPR ARAL BK 
(比如 bool 这 种 ) ， 但 它 代 表 所 有 权 唯 一 的 智能 指针 的 特殊 性 ， 所 以 
需要 使 用 Lang Item 来 专门 识别 ， 而 其 他 的 智能 指针 则 不 是 这 样 的 。 

Box<T 之 和 其 他 智能 指针 相同 的 地 方 在 于 内 部 都 使 用 了 了 box 关键 字 
来 进行 堆 分 配 。 代 人 码 清单 5-49 罗 列 了 Box: : new, Re: : new 和 
Arc: : new 方 法 的 源码 o 

代码 清单 5-49: Box: : new. Re: : new 和 Arc: : new 方 法 的 源 


区 
pub In newt: D) => Box<T> 9 


box x 


Tm bl Kecl> | 


sh 

2 

3 

4 

T } 
6 

7] pus in new(value: TT) => Bol 1 
8 

9 


unsafe { 
Re { 

10. ptre Shared; :new(Box;:i1nteo raw(box ReBox {})), 
Li } 
L2. } 
Le } 
14. } 
152 inpl<tT> Are<T> 4 
Lies pub In new(datas T) -> ArcxklT> 1 
j Bn LSE 3: Boss 2 = DOS APCINne® 1h; 
18. } 


为 了 展示 方便 ， 代 人 码 清 单 5-49 管 略 了 具体 实现 的 很 多 代码 。 但 是 可 
以 看 得 出 来 ， 这 几 个 方法 都 使 用 了 box 关 键 字 来 进行 堆 内 存 分 配 。box 关 
键 字 只 可 以 在 Rust 源 人 码 内 部 使 用 ， 并 未 作为 公开 API 使 用 。 

box 关 键 字 会 调用 内 部 堆 分 配方 法 exchange_malloc 和 堆 释 放 方 法 
box_free 进 行 扒 内 存 管 理 ， 相 关 代 码 如 代码 清单 5-50 所 示 。 

代码 清单 5-50:; box_free#llexchange_malloci) 147 & 


[| 

2. #{inline] 

J» publ(¢rabe) unsate In box Tree<Ty Poized>(prrs mut T) d 
4. sad 

os Heap.dealloc(ptr as *mut u8, layout); 

Ge | 

7. #[cfg (not (test) ) ] 

8. #Llang = “exchange malloc" 

9. #[inline] 


LQ. unsafe tn exchange malloc(size: usize, align: usize) -> *mut ug { 


12 5 Heap.alloc(layout)... 
ik: d 


代码 清单 5-50 中 展示 了 box_free 和 exchange_malloc 方 法 的 部 分 源码 
实现 ， 看 得 出 来 ， 这 两 个 方法 都 航标 注 为 了 Lang Item， 方 便 编 详 右 来 识 
别 。box_free 用 于 释放 (dealloc) 堆 内 存 ，exchange_malloc 用 于 分 配 
(alloc) HEA FF. 


5.6.1 ES APA WW Re<T> AlWeak<T> 


引用 计数 (reference counting) 可 以 说 是 简单 的 GC 算 法 之 一 了 ， 应 
用 于 多 种 语言 。Rust 中 提供 了 Rc<T> 智 能 指针 来 支持 引用 计数 ， 但 不 
同 于 GC 的 是 ，Rust 是 确定 性 的 析 构 ， 开 及 者 知道 资源 什么 时 候 会 被 析 
AE 

Rust 中 只 有 拥有 上 所有权 才能 释放 资源 ，Rc<T> 可 以 将 多 个 所 有 权 
共 诗 给 多 个 变量 ， 每 当 共 至 一 个 所 有 权时 ， 计 数 束 会 增加 一 次 ， 只 有 妆 
计数 为 零 ， 也 束 是 当 所 有 共 至 变量 离开 作用 域 时 ， 访 值 才 会 被 析 构 。Rc 


<< 工 > 主要 用 于 希望 共享 推 上 分 配 的 数据 可 以 供 程序 的 多 个 部 分 读 取 的 
场景 ， 并 且 主 要 确保 共享 的 资源 析 构 函数 都 能 被 调用 到 。Rc<T> 是 单 
线程 引用 计数 指针 ， 不 是 线程 安全 的 类 型 ，Rust 也 不 允许 它 被 传递 或 共 
译 给 别 的 线程 ， 如 代码 清单 5-51 所 示 。 

代码 清单 5-51: Rc 二 TT 示例 


Le thas Seas ene st ROC 

2 Lm marmi) a 

3 let x = Rc::new(45); 

-m let yl = x.clone(); // E omiri JIE 

De let y2 = x.clone(); // AiR S Hip ae 

6 prina” ser". Res strong count-(4s) jy 
7 Let w = Re: :downgrade(&x); // 增加 弱 引 用 计数 
Bie princilni ("1 iti", Bes fweak. Sent (es) 5 
9. let y3 = &*x; // 不 增加 计数 

1.0) prEipntAni ("ii ", 200 = 1x]? 

lise 4 


Rc<I > 定义 于 标准 库 std:， : rc 模块 ， 使 用 use 声 明 可 以 省 略 挥 前 和 面 
的 命名 空间 直接 使 用 Rc。 第 3 行 代码 声明 了 绑 定 x， 第 4 行 和 第 5 行 分 别 调 
ARs —iKelone iE, KAVA DUS RSES SPAR, TEJA PTAA, B 
6 行 通 过 Rc: : strong_count 方 法 输出 引用 计数 ， 一 共 是 3 次 。 注 意 这 里 
的 clone 方法 并 非 深 复制 ， 只 是 徐 单 地 对 共 带 所 有 权 的 计数 ， 但 是 这 个 
计数 操作 会 产生 一 定 的 计算 型 开销 。 

通过 clone 方 法 共 吾 的 引用 所 有 权 被 称 为 强 引 用 。 第 7 行 代码 使 用 了 
downgrade 方 法 创建 了 另外 一 种 智能 指针 类 型 Weak<T>， 它 也 是 引用 
计数 指针 ， 属 于 Rc<TI> 的 另 一 种 版 本 ， 它 共有 的 指针 没有 所 有 权 ， 上 所 
以 被 称 为 弱 引 用 “， 但 ”Weak<T> 还 保留 对 Rc<T> 中 值 的 引用 。 
Re: : strong_count 返 回 的 是 强 引 用 的 计数 ，Rc: : weak_counti& [al Hy 
征 弱 引用 的 计数 。 

在 第 4 章 中 ， 我 们 用 Rc 二 T>>“ 精 心 * 构 造 了 一 个 内 存 泄漏 的 示例 。 现 
在 了 解 了 Weak 二 TIT 之后， 就 可 以 利用 Weak 二 TT 二 无 所 有 权 的 特点 对 其 
进行 改造 了 ， 如 代码 消 单 5-52 所 示 。 

代码 清单 5-52: 利用 Weak< 工 > 解决 循环 引用 的 内 存 汇 漏 问 题 


lL, use stds: re:sKe; 

2. use std::rc::Weak; 

3. use std::cell::RefCell; 

4. struct Node { 

By. next: Option<Rc<RefCell<Node>>>, 

6. head: Option<Weak<RefCell<Node>>> 

% i 

8. a impl Drop for Node { 

oy fn drop(&mut self) { 

LQ. printin! ("Drepping!™); 

11. } 

1A. } 

13. fn Main) { 

14. let first =Rc::new(RefCell::new(Node { next: None, head: None })); 

13, let second = Rcec::new(RefCell::new(Node { next: None, head: 
None })); 

16. let third = Rc: :new(RefCell: :new (Node { next: None, head: None })); 

leks first.borrow mut().next = Some(second.clone()); 

18. second.borrow mut().next = Some(third.clone()); 

12. third.borrow mut().head = Some(Rc::downgrade (&first))? 

20. } 


在 代码 清单 5-52 中 ，Node 结 构 体 中 增加 了 另 一 个 成 员 head， 专 门 用 
于 链接 头 部 和 尾部 的 Node。 而 next 成 员 专 门 用 于 链接 下 一 个 Node。 

第 14 行 宇 第 16 行 分 别 创 建 了 三 个 节点 ， 而 且 next 和 head 都 被 设 置 为 
J None. 

第 17 行 将 second 节 点 的 所 有 权 通 过 强 引 用 方式 共享 给 了 first 的 next， 
也 束 是 将 first 和 second 连 了 起 来 。 

第 18 行 将 third 节 点 的 所 有 权 退 过 强 引 用 方式 共享 给 了 second 的 
next， 也 就 是 将 second 和 third 连 了 起 来 。 

第 19 行 将 third 节 点 的 所 有 权 通 过 弱 引 用 方式 共享 给 了 first 的 head， 
也 就 是 将 third 和 first 连 了 起 来 。 

最 终结 果 如 图 6-8 所 示 。 





图 5-8: 使 用 Weak<T> 解 决 循环 引用 示意 图 


运行 代码 清单 5-52， 你 会 发 现 drop 方 法 都 能 被 正常 调用 了 ， 证 明 已 
经 不 存在 内 存 进 漏 的 问题 了 。 顺 便 提 一 可， 循环 引用 引起 内 存 泄漏 的 问 
题 还 可 以 通过 使 用 Arena 模 式 来 解决 。 何 单 来 说 ， 就 古 利用 线性 数组 来 
模拟 市 点 之 间 的 关系 ， 可 以 有 效 如 免 人 循环 引用 。 


5.6.2 WAE a5 te Cell T> 和 RefCell 一 工 > 


Rust 中 的 可 变 或 不 可 变 主要 是 针对 一 个 变量 绑 定 而 言 的 ， 比 如 对 于 
结构 体 来 说 ， 可 变 或 不 可 变 只 能 对 其 实例 进行 设置 ， 而 不 能 设置 蛙 个 成 
员 的 可 变性 。 但 是 在 实际 的 开发 中 ， 茶 个 字段 是 可 变 而 其 他 字段 不 可 变 
的 情况 确实 存在 ， 比 如 在 网 络 请 求 中 ， 每 个 请 求 包 含 的 路 径 、 参 数 等 状 
态 ， 都 应 该 是 可 变 的 。Rust 提 供 了 Cell<T> 和 RefCell<T> 来 应 对 这 种 
情况 。 它 们 本 质 上 不 属于 智能 指针 ， 只 是 可 以 提供 内 部 可 变性 Cinterior 
Mutability) #45. 

Cell<T> 

Al aid Ay Ae ESE Pp Exe Rust FA ARHAN. FAD AREAS BB eT 
Struct 的 一 种 封闭， 表面 不 可 变 ， 但 内 部 可 以 通过 某 种 方法 来 改变 里 面 
的 值 ， 代 码 清单 5-53 所 示 的 是 使 用 Cel<T > 实现 字段 级 可 变 的 情况 。 

代码 清单 5-53: 使 用 Cell 一 工 > 实现 字段 级 可 变 


is use std::cell::Cell; 

on struct Foo | 

Ef es Uae, 

4. Vi Cell<usz> 

二 } 

6. fn main{)}{ 

a: let foo = Foo { x: 1, yè Cell: :new(3) }; 
8. assert egi {ly TOO: X)? 

sA Se eC! (3,foo.¥.gst |) ); 
10. roo. ¥. Set (3) 7 

Tis assert egi (5, THO. y «DEE ()) 
lže J 


代码 清单 5-53 中 定义 了 结构 体 Foo， 其 中 字段 x 是 u32 类 型 ，y 是 Cell 
二 U32 放 类 型 ，main 了 水 数 中 创建 了 该 结构 体 的 实例 ”foo， 默 认 是 不 可 变 
的 。 第 9 行 代码 通过 ge O 方法 来 取得 Cell 二 u32 二 容器 中 的 值 ， 第 10 
行 代码 通过 set〈) 方法 来 重新 设置 y 的 值 。 整 个 代码 编译 成 功 。 

使 用 Cell<T 二 内 部 可 变 容 器 人 确实 方便 了 编程 。 它 提供 的 set/get 方 法 
像 极 了 OOP 语 言 中 和 常见 的 setter/getter 方法 ， 封 装 了 对 象 属性 的 获取 和 
设置 行为 。Cell<T> 通 过 对 外 骏 露 的 set/get 方 法 实现 了 对 内 部 值 的 修 
改 ， 而 其 本 映 却 是 不 可 变 的 。 所 以 ， 实 际 上 Cell<T> 包 于 的 T 本 喘 合 法 
地 避 开 了 借用 检查 。 

对 于 包 囊 在 Cell<T > 中 的 类 型 T， 只 有 实现 了 Copy 的 类 型 T， 才 可 

以 使 用 get 方 法 获取 包 囊 的 值 ， 因 为 get 方 法 返回 的 是 对 内 部 值 的 复制 。 
但 是 任何 类 型 T 都 可 以 使 用 set 方 法 修改 其 包 圳 的 值 。 由 此 可 见 ，Cell<T 
> 并 没有 违反 Rust 保 证 的 内 存 安全 原则 ， 对 于 实现 Copy 的 类 型 T， 可 以 
任意 读 取 ; 对 于 没有 实现 Copy 的 类 型 T， 则 提供 了 get_mut 方 法 来 返回 可 
变 人 借用， 依然 遵循 Rust 的 借用 检查 规则 。 

使 用 Cell<T> 虽 然 没 有 运行 时 开销 ， 但 是 尽量 不 要 用 它 包 囊 大 的 
结构 体 ， 应 该 像 代码 清香 5-49 那 样 选择 包装 菜 个 字段 ， 因 为 Cell<T 才 内 
部 每 次 get/set 都 会 执行 一 次 按 位 复制 |。 

RefCell<T> 

对 于 没有 实现 Copy WAAAY, ACel<T> AWS HH. Rust 提供 


WJRefCel<T>iG AAU, XPOS TIER A CopyH Rt, ARIS 
音 5-54 展 示 了 其 内 部 可 变性 。 
代码 清单 5-54: RefCell<T> 内 部 可 变性 示例 
Ai use std::cell::RefCell; 


2 fn main() { 

3 let x = RefCell::new(vec! [1,2,3,4]); 
4. LE 

3 x.borrow mut().push(5); 

6 DeLisi. ("Lee PR, XePOrrow i] ] i 

7 } 


RefCell<T> EE JS borrow/borrow_mut/7yz, ¥})VCell<T> Ky) 
get/set 方 法 。RefCell<T 才 虽然 没有 分 配 空间 ， 但 它 是 有 运行 时 开销 
的 ， 因 为 它 上 自己 维护 看 一 个 运行 时 借用 检查 器 ， 如 果 在 运行 时 出 现 了 违 
有 反 借 用 规则 的 情况 ， 比 如 持 有 多 个 可 变 借 用 ， 则 会 引发 线程 panic， 如 清 
单 代码 5-55 所 示 。 

代码 清单 5-55: 违反 RefCell=<T> 运 行 时 借用 规则 ， 会 引发 线程 


panic 

use std::cell::RefCell; 

2 fn main() { 

3 let x = RefCell: :new (vec! [1,2,3,4]); 

4. let mut mut v = x.borrow mut(); 

a mut v.push (95); 

6 // thread 'main' panicked at 'already borrowed: BorrowMutError', 
7 // let mut mut v2 = x.borrow mut (); 

8. | 


代码 清单 5-55 的 第 7 行 通过 borrow_mnut 方 法 第 二 次 获取 可 变 借用 ， 
这 显然 违反 了 借用 规则 ， 虽 然 是 运行 时 检查 ， 但 其 倍 用 规则 和 Rust 编 
译 占 借用 检查 规则 是 一 样 的 ， 所 以 此 时 main 函 数 线 程 束 会 朋 沉 ， 并 抛 出 
第 6 行 注释 所 示 的 错误 内 容 。 

Cell<T 之 和 RefCell<T> 使 用 最 多 的 场景 束 是 配合 只 该 引用 来 使 
FA, EGQU&TEYRe<T>. ERE 5-497 WAC a  Ro<RefCell< 
T>>。Cell<T> 和 RefCeall<T> 之 间 的 区 别 可 以 总 结 如 下 : 


Cell <T> 18 A set/get iii ERREEN, RefCell<T> iti 
borrow/borrow_muti [Hl #22 wy 5] ARef <T> #lRefMut<T > RHEE, 
里 的 值 。 

* Cell< 了 二 一 般 适 合 复 制 语义 类 型 (实现 了 Copy) , RefCell<T> 
一 般 适 合 移 动 语 义 类 型 (未 实现 Copy) 。 

Cell 天 工 > 无 运行 时 开销 ， 并 且 永 远 不 会 在 运行 时 引发 panic 错 误 。 
RefCell<T 之 需要 在 运行 时 执行 信用 检 杏 ， 所 以 有 运行 时 开销 ， 一 旦 及 
现 违 反 借用 规则 的 情况 ， 则 会 引发 线程 panic 而 退出 当前 线程 。 

在 日 党 的 编程 开发 中 ， 不 要 为 了 专门 避 开 借用 检查 而 使 用 Cell <T 
> 或 RefCell<T>， 而 应 该 仔细 分 析 共 体 的 需求 来 选择 适合 的 解雇 方 
人 


5.6.3 写 时 复制 Cow 去 工 > 


与 时 复制 (Copy on Write) 技术 是 一 种 程序 中 的 优化 案 略 ， 补 应 用 
于 多 种 场景 。 比 如 Linux 中 父 进 程 创建 子 进程 时 ， 并 不 是 立刻 让 子 进程 
复制 一 份 进程 空间 ， 而 是 先 让 子 进 程 共享 父 进程 的 进程 空间 ， 只 有 等 到 
子 进程 真正 需要 写 入 的 时 候 才 复制 进程 空间 。 这 种 “拖延 ”技术 实际 上 很 
好 地 减少 了 开销 。Rust 也 米 纳 了 这 种 思想 ， 提 供 了 了 Cow 二 TIT 二 容 桥 。 

Cow 三 TIT 是 一 个 枚 举 体 的 智能 指针 ， 包 括 两 个 可 选 值 : 

‘Borrowed, H+ #2251 H- 

- Owned, HT HMA. 

FN Option <T> KWA AAA, Option <T> a Me 18 
HAME”, m Cow<T> ean ENANA AEH MA” 

Cow<T> ERDRE, WANA ANAS A A, URE 
fi 2 AY AO fe FA BY Ag OY EY Aa Fo E — 1 BE > Cow<T> HLY 
Deref， 这 曹 味 看 可 以 直接 调用 其 包含 数据 的 不 可 变 方 法 。Cow 二 TI 二 有 
在 减少 复制 操作 ， 提 高 性 能 ， 一 般 用 于 旋 多 与 少 的 场景 ， 如 代码 清单 5- 
56 所 示 。 

代码 清单 5-56: Cow< 工 > 示例 


BY wl © OF & GW RO FF 


use std: : borrow: Cow; 
&mut Cow<[i32]>) { 
Cor 1 TH Bas Tit emt) { 


tn abs all (anput: 


let v = input ily 


Lc yr <= 8 4 


input.to mut() [a] = =y} 


} 


tn abs sum(nss &[132] ) 


let mut lst = 


abs all(é&mut lst); 


LSE LESES Wola 60, 


} 


Tr Meri) « 


// 这 里 没有 可 变 需 求 ， 所 以 不 会 克隆 


lee SL = [fL.zZ, 


3]; 


= Use x 


Cow: strom (ns) ; 


lace, &n] 


acc + n) 


Lee mut. DL = Cowzr:Erom(esi. [«< |) 2 
abs all (é&muat il); 


SETHE | A T TN 
PELAILLA. ("Ours 


tee", 


Leon y 


S1) 7 
WEG 


// 这 里 有 可 变 需 求 ， 所 以 会 元 隆 


23 a 
24. 
2I s 
26s 
Zl 
23. 
2 v 
20 
BL. 
ae s 
a3 。 
34. 
JI s 
30. 
can 
30 s 
2; 
40. 
41. 
42. 
43. 
44. 
45. 


} 


// 注意 : 借用 数据 被 克隆 为 了 新 的 对 象 
//s2 != i2. 实际 上 ，s2 不 可 变 ， 也 不 会 被 改变 
bet = 

let mut 12 = Cow::from(&s2[..]); 
abs all(&mut 12); 

PELATLAL ("INS {El} B2)? 
princilns ("CUPS Per, Lape; 

// 这 里 不 会 克隆 ， 因 为 数据 本 身 拥有 所 有 权 
// 注 意 : 在 本 例 中 ，v1 本 身 就 是 可 变 的 
let mut vl = Cow::from(vec! [1,2,-3,4]); 
abs all(é&mut vl); 
printcini("INZOUTSs LT "ss VL) 
// 没 有 可 变 需求 ， 所 以 没有 克隆 

LEE [1 

let sumi = abs_sum(&és3[..])¥ 
BT ,» Ba)g 
Bee C L"; BEL) 

// 这 里 有 可 变 需 求 ， 所 以 发 生 了 克隆 

bet s4 = 【dr 一 SS 一 总 | 3 

let sumz = abs sum(é&s4[..]); 
prime ln CNL ese, B4)4 
Sfantrinl('{[}", siz); 


代码 清单 5-56 中 定义 了 一 个 函数 abs_all， 用 于 求 数组 中 元 素 的 绝对 
值 。 访 函数 参数 类 型 为 Cow<[i32]>， 迭 代 每 个 元 素 ， 当 判断 出 元 素 值 
小 于 0 ”的 时 候 ， 调 用 to_mut 方 法 获取 可 变 借 用 来 修改 值 。 男 外 一 个 函数 
abs_sum 利 用 了 abs_all 函 数 求 元 聂 绝对 信之 后 再 进行 求 和 。 

代码 第 17 行 到 第 21 行 声明 了 两 个 绑 定 sl1 和 i1， 其 中 1 是 通过 
Cow: : from 方 法 来 创建 的 。 并 且 将 &mut il 作 为 参数 传 给 abs all ži, 
因为 sl 中 元 系 都 大 于 0， 所 以 并 不 进入 该 阔 数 中 的 if 表 达 式 里 ， 也 就 不 会 
调用 to_mnut 方 法 ， 所 以 ， 并 不 会 发 生死 隆 。 所 以 第 20 行 和 第 21 行 的 输出 


为 如 下 。 


OUT: [ly By ol 
代码 第 25 行 到 第 29 行 的 S2 中 包含 小 于 0 的 元 素 ， 所 以 会 进入 abs_all 
pe aif ssrA TRA, KAS SAA to mut 方法 ，to_mut 方法 会 在 第 一 次 调 
用 时 元 隆 一 个 新 的 对 象 ， 在 后 续 的 for 循 环 中 继续 用 新 的 元 隆 对 象 。 所 以 
第 28 行 和 第 29 行 的 输出 如 下 。 
IN? Tle Zs 2y ~45, 5] 
OUT: [ie frp te Ba, S] 
第 32 行 到 第 34 行 声明 vl, HCow<T> BBWAA SS eA 
所 有 权 的 类 型 Vec<T>， 因 此 在 进入 abs_all 函 数 的 让 表 达 陈 中 时 ， 调 用 
to_mut 方 法 并 不 会 元 隆 新 对 象 ， 所 以 此 处 输出 如 下 。 
TN | 
第 36 行 到 第 39 行 虽然 调用 了 abs_sum， 但 还 是 会 调用 abs_all 函 数 去 
求 绝对 值 。 因 为 此 时 Ss3 中 的 元 妓 都 是 大 于 零 上 的 ， 所 以 不 会 调用 to_mnut 方 
法 ， 此 处 不 会 发 生 元 隆 ， 所 以 此 处 输出 如 下 。 
[| 
L5 
第 41 行 到 第 44 行 的 S4 中 包含 负数 ， 所 以 肯定 会 调用 to_mnut 方 法 ， 此 
处 会 发 生死 隆 ， 所 以 输出 如 下 。 
L; =3, 5; =6] 
15 
通过 代码 清单 5-56 可 以 看 出 来 ，Cow<T> 确 实 做 到 了 写 时 复制 的 
效果 ， 在 使 用 它 的 时 候 ， 需 要 和 擎 握 以 下 几 个 要 点 。 
“Cow 三 二 实现 了 Deref， 所 以 可 以 下 接 调 用 TT 的 不 可 变 方 法 。 
. 在 需要 修改 工时 ， 可 以 使 用 to mit 方法 来 获取 可 变 借用 。 该 方法 
会 产生 元 障 ， 但 仪 元 隆 一 次 ， 如 果 多 次 调用 ， 则 只 会 使 用 第 一 次 的 元 隆 
对 销 。 如 果 T 本 里 拥有 有 所有权， 则 此 时 调用 to_mut 个 会 发 生 元 隆 。 
. 在 需要 修改 T 时 ， 也 可 以 使 用 into_owned 方 法 来 获取 一 个 拥有 所 有 
权 的 对 象 。 如 果 工 是 合用 类 型 ， 这 个 过 程 会 发 生死 隆 ， 并 创建 新 的 所 有 
权 对 象 。 如 果 T 是 所 有 权 对 象 ， 则 会 将 所 有 权 转 移 到 新 的 克隆 对 象 。 


Cow< 工 > 的 另 一 个 用 处 是 统一 实现 规范 。 比 如 现在 需要 设计 一 个 
结构 体 ”Token， 用 来 存放 网 络 上 的 各 种 token 数 据 ， 但 是 这 些 token 不 都 
是 字符 串 字 面 量 ， 还 可 能 是 动态 生成 的 值 。 到 底 访 用 &str 类 型 还 是 
String 类 型 呢 ? 为 了 寻求 统一 ， 这 里 使 用 了 Cow<T>， 如 代码 清单 5-57 
所 示 。 

代码 清单 5-57: 利用 Cow<T > 来 统一 实现 规范 


iN Use Sted: : borrows slow; 

ca use std::thread; 

3. # [derive (Debug) ] 

4. tr TOKS N> 1 

J. row: Cow's, str, 

6. } 

ce impl<'a> Token<'a> { 

8. pub fn new<S>(raw: S) -> Token<'a> 
9. where 

sd Sc iInbetlews" a, Serer, 

Li { 

12. Token { raw: raw.into() } 

13. } 

14. } 

ls Im main() { 

LO; let token = Token: :new ("abc123"); 
Lalo Let token = Token! me a -eName 1.0" to Strang I} 
1s thread: :spawn (move || { 

Le printin: ("tokens «37 )", oxen); 
20. Rs SOLE) s Urta) 3 

Pike f 


TEARS PS-57', Za RA Token H AYR! NCow<’ a, str> 
类型， 在 main 国 数 中 ， 不 管 传 入 的 是 & static str 还 是 String 类 型 的 字符 
串 ， 都 通过 into 方 法 被 转换 成 了 Cow<</ a，str 之 ， 这 就 实现 了 统一 。 并 
且 对 于 字符 串 字 面 量 和 String 类 型 来 说 ， 还 可 以 跨 线 程 安全 传递 。 

但 是 如 果 创 建 token 的 时 候 使 用 动态 字符 串 切 片 ， 则 会 因为 生命 周 
期 的 问题 而 无 法 路 线程 安全 传递 ， 比 如 将 main 函 数 修改 为 代码 清单 5-58 


所 示 的 情况 。 
代码 清单 5-58: 无 法 跨 线 程 传 好 动 态 字 从 串 切 厂 的 情况 示例 


i, fn main() { 

EA let raw = String::from("“abec”™) ; 

Si let s = &raw[..]; 

4. let token = Token::new(s) ; 

5. thread: :Spawn (move || { 

6. printim! ("tokens {r?7}", token) : 
Ty F] 70104) .unwrap () 3 

8. } 


代码 清单 5-58 编 译 会 出 错 : 


error[E0597]: raw does not live long enough 


5.7 并 友 安 全 与 所 有 权 
Rust 的 内 存 安全 特性 也 非常 适合 用 于 并 发 ， 保 证 线程 安全 。 第 3 章 








已经 讲 过 ，Rust 使 用 了 两 个 标签 trait Send 和 Sync 来 对 类 型 进行 
LN HE 
JJ KR o 


“ 如 来 类 型 KIY Send, Wize E V nE ARA SE Bl BY 以 在 线 
FEH 2242 7 ATA AX 

UNRATE f Sync, Wie M hm PE ar K HY ASSAY AY SC Ee RTE 
开 友 中 个 可 能 叶 作 内存 个 安全 ， 所 以 可 以 安全 地 器 线程 共 圣 。 

正 是 这 两 个 特殊 的 trait 你 证 了 并 及 情 况 下 的 所 有 权 。 代 码 清单 5-59 
所 示 为 线程 不 安全 的 一 个 示例 。 

代码 清单 5-59: 线程 不 安全 示例 


ji use std::thread; 
2 fn main() { 
3 let mut data=vec![1, 2, 3]; 
4 ESE 2 2h 9.3 4 
Ya thread: :spawn (move|| { 
6 data[i] +=1; 
7 } ) 7 
8 } 
9 thread: :sleep ms (50) ; 
10. } 
代码 清单 5-59 编 译 会 报 如 下 错误 : 
error[E0382]: capture of moved value: data 
7 | thread: :spawn(move|| { 
| ee- value moved (into closure) here 
8 | data[i] +=1; 


| ANANN 


value captured here after move 
HRE, data ANOA F J, (E7 mE ara E EERE 
H, MAR. MIA 5-596 RIENE, EE RIE BME 


Adata h 70 az 5 | HLA tH 

Rust 提 供 了 一 些 线程 安全 的 同步 机 制 ， 比 如 Arc< 工 > Mutex<T 
>>、RewLock<T > 和 Atomic 系 列 类 型 。 下 面 是 关于 这 些 类 型 的 从 要 说 
HH 

Arc 二 本 是 线程 安全 版 本 的 Rc 二 T>。 

-Mutex< 工 > 是 锁 ， 同 一 时 间 仅 允许 有 一 个 线程 进行 操作 。 

RwLock< 工 > 相当 于 线程 安全 版 本 的 RefCell< 工 >， 同 时 运行 多 
个 reader 或 者 一 个 writer。 

Atomic 系列 类 型 包括 AtomicBool、AtomicIsize、AtomicUsize 和 
AtomicPtr 这 4 和 种， 虽然 比 较 少 ， 但 是 可 以 用 AtomicPtr 来 模拟 其 他 想 要 
的 类 型 ， 它 相当 于 线程 安全 版 本 的 Cell 二 T>。 

关于 并 发 安全 ， 第 11 章 中 会 有 更 详细 的 内 容 。 


5.8 非 词法 作用 域 生命 周期 


Rust 严 格 的 借用 检查 规则 虽然 避免 了 苹 王 指针 ， 保 证 了 内 存 安全 ， 
但 是 代码 的 开发 体验 还 是 差强人意 的 。 有 时 候 严格 的 借用 检查 规则 会 让 
代码 变 得 非常 难以 理解 ， 如 代码 清早 5-60 所 示 。 

代码 清单 5-60: 让 人 难以 理解 的 代码 错误 


1 EN TOOS" a> (Xi K'a SEL, YE Ga SEX) ~> "A SEFE | 
2 if x.len() % 2 == 0 { 

3 x 

4. } Glee i 

a. y 

6 } 

7 } 

8 fn main() { 

9. let x = Strang: :trom("hello”) ; 
LD). let z; 

ile S let y = String::from("world"); 
LZ. z = foo(&x, &y); 

Da 3 

14. } 


代码 清单 5-60 编 译 会 出 错 ， 提 示 代 码 第 12 行 中 &y 借 用 存活 时 间 不 够 
长 。 但 是 修复 这 个 错误 很 简单 ， 只 需要 将 第 10 行 和 人 第 11 行 代码 互 换 位 置 
即 可 。 

这 种 行为 让 人 很 困惑 。 因 为 在 其 他 语言 中 ， 基 本 上 不 会 出 现 这 种 情 
部。 这 其 实 是 由 Rust 目 前 的 借用 检查 机 制 粒 度 太 粗 导 人 至 的 。 对 于 代码 清 
单 5-60 中 定义 的 x、y、z 三 个 变量 绑 定 来 襄 ， 和 生命 周期 的 长 上 度 由 定义 的 
先后 顺序 来 决 定 ， 本 质 上 是 和 词法 作用 域 相关 的 。 生 命 周 期 长 上 度 天 系 
A: ”x 有 的 生命 周期 最 长 ，z 的 次 之 ，y 的 最 短 。 代 人 码 第 12 行 将 &y 传 入 foo 
国 数 时 ， 必 须 满足 借用 检查 规则 ， 即 借用 方 的 生命 周期 不 能 长 于 出 借方 
的 生命 周期 。 此 时 z 是 借用 方 ，y 是 出 借方 ， 而 目前 们 用 方 z 的 生命 周期 
明显 长 于 出 借方 y 的 ， 故 编 详 占 报 错 。 按 上 述 解 决 方法 将 代码 互 换 位 置 


Ze, AAA APAIKRRER AAA: xi aaa, yZ, ZK 
A, Weta te L.A PEE a 

在 了 解 过 其 背后 的 机 制 之 后 ， 束 可 以 理解 这 样 的 行为 了。 但 是 这 个 
问题 往往 是 初学 者 认为 Rust 语 言 很 难 和 掌握 的 原因 之 一 ， 实 际 开发 也 非常 
不 便 。 因 此 ，Rust 团 队 在 Rust 2018 版 本 中 引入 了 非 词 法 作用 域 生 命 周 期 
(Non-Lexical Lifetime, NLL ) 来 进行 改善 。 

基于 MIR 的 借用 检查 

第 1 章 介绍 过 Rust 的 编译 过 程 ， 从 源码 到 抽象 语法 树 ， 然 后 再 由 抽 
象 语法 树 到 高 级 中 间 语 言 (HIR) ， 再 由 HIR 到 中 级 中 间 语 言 
(MIR) ， 最 后 由 MIR 到 LLVM IR。 当 前 的 借用 检查 器 是 基于 词法 作用 
域 的 ， 有 具体 到 编 诺 层面 ， 是 基于 抽象 语法 树 CAST) 之 后 的 HIR。HIR 
FEAST 的 简化 版 本 ， 所 以 借用 检查 硕 本 质 上 还 是 基于 AST 的 。 如 果 要 
改进 借用 检查 帮 ， 束 必须 再 往 下 一 层 ， 米 用 更 细 粒 撒 的 MIR。 

MIR 是 基于 控制 流 图 (Control Flow Graph, CFG ) 的 抽象 数据 
Ht), CHARA (DAG) 形式 包含 了 程序 执行 过 程 中 所 有 可 能 的 流 
转 。 所 以 将 基于 MIR 的 借用 检查 称 为 非 词法 作用 域 的 生命 周期 ， 因 为 确 
实 不 依赖 词法 作用 域 了 。 在 NLL 最 终 发 布 之 后 ， 这 个 名 词 术 语 很 可 能 就 

MIR 由 以 下 关键 部 分 组 成 。 

` 基本 块 (Basic Block, bb) ， 它 是 控制 流 图 的 基本 单位 ， 

>E] (Statement) 

> JEJ (Terminator) 

本 地 (Local ) 变量 ， 栈 中 内 存 的 位 置 ， 比 如 函数 参数 、I 临 时 
值 、 局 部 变量 等 。 一 般 用 下 男 线 和 数字 作为 标识 〈 比 如 1) ， 其 中 _0 通 
第 表示 返回 值 地 址 。 

位置 (Place) ， 在 内 存 中 标识 位 置 的 表达 式 ， 比 如 _1 或 _ 1.f。 

` HE (RValue ) ， 产 生 值 的 表达 式 ， 一 般 是 指 赋值 操作 有 的 右 侧 
KIAN PM EEKAN. 

用 于 生成 MIR 的 代码 示例 如 代码 清单 5-61 所 示 。 

代码 清单 5-61: 用 于 生成 MIR 的 代码 示例 


i fn main() { 
2 let a = 1; 
3. a + 2; 
4. } 
代码 清单 5-61 可 以 在 play.rust-lang.org 中 生成 MIR 代 码 ， 如 代码 清单 
5-62 所 示 。 
代码 清单 5-62: 生成 的 MIR 代 码 


1. // MIR 解释 

2 Ch. Watt) -> (J4 

3 let mut 0: (); 7/ WEHE 

4 scope 1 { // 第 一 个 变量 产生 的 顶级 作用 域 ， 会 包 庄 其 他 变量 
} 

6 scope 2 { // a 自己 的 作用 域 

7 let 1: i32; 

8 } 

9. let mut 2s i32; // 临时 值 

10. let mut Of 132; 

ls lec 到 

ia. pb0: { // 基础 块 

StorageLive( 1); // 语句 ， 代表 活 跃 ，LLVM 用 它 来 分 配 栈 空间 
14. _1 = const 1132; // Wa 

L5. StorageLive( 3); 


16. 3=_1; // 使 用 临时 变量 


he // 执行 Add 操作 ， 有 具有 防洪 出 检查 ， 


18. // EP move KR move 语义 ， 编 译 器 会 自己 判断 是 不 是 Copy 

| 4 = CheckedAdd(move 3, const 2132); 

20. // 断言， 溢出 时 抛 出 错误 ， 并 且 流向 pbl 块 。 此 为 终止 名 

2L. assert(!move ( 4.1: bool), "attempt to add with overflow") 
Ze. => bol 

vo } 

24. bbl: | // 基础 块 

25. 2 = move ( 4.0: i132); // 赋值 ， 右 值 默认 是 move 

26. StorageDead( 3); // #4), RATER, LLM A'E RIER Z i] 
A Is StorageDead( 1); 

28. return; p // 8A 

29, } 

30. 1 


代码 清单 5-62 是 代码 清单 5-61 生 成 的 MIR 代 码 ， 请 注意 但 看 上 面 配 
僚 有 的 注释 。 整 体 来 说 ， 访 段 代码 分 成 两 个 基本 块 ， 从 bb0 流 同 bbl1。 其 中 
StorageLive 和 StorageDead 语 名 表示 变量 的 活跃 信息 ， 访 活跃 信息 将 会 及 
给 LLVM，LLVM 会 根据 此 信息 将 变量 分 配 到 不 同 的 栈 权 (Stack 
Slot) 。 只 有 活跃 的 变量 才 可 以 使 用 。 谈 者 可 以 目 行 答 试 使 用 更 加 复杂 
的 代码 生成 MIR， 在 其 中 还 会 发 现 drop 等 语句 ， 其 实 束 是 由 编译 右 目 动 
插入 的 drop flag。 

那么 非 词 法 作用 域 生命 周期 的 工作 机 制 是 怎样 的 呢 ? 它 的 工作 原理 
可 以 概述 为 以 下 两 个 阶段 。 

信用 检查 第 一 阶段 : 计算 作用 域 范 围 〈《Scope) 内 的 舍 用 。 在 GEFC 
中 的 每 个 节点 计算 一 系列 的 们 用 ， 并 将 其 表示 为 元 组 ， 形 如 ("a， 
sharedluniqlmut，lvalue ) , SLA’ a 表示 生命 周期 参 
数 ，sharedluniqlmnut 分 别 表 示 共 享 、 独 占 和 可 变 ，lvalue 表示 左 值 。 然 
后 再 进行 各 种 计算 ， 随 寿 数据 流 进 行 传播 。 

借用 检查 第 二 阶段 ， 报告 错误 。 在 确定 了 借用 范围 之后 ， 通 过 过 

历 MIR 来 计算 范围 内 的 非法 售 用 。MIR 中 的 各 种 语句 将 铂 上 用 场 ， 比 
如 StorageLive、drop 等 。 

目前 NLL 还 在 实现 阶段 ， 昌 然 解决 了 一 部 分 问题 ， 但 是 还 有 更 多 问 


题 需要 解决 。 关 于 NLL 更 详细 的 内 容 可 以 参考 相关 RFC H 。MIR 除 了 
做 借用 检查 ， 还 做 边界 、 洲 出 和 区 配 等 检查 。 关 于 MIR 更 评 细 的 介绍 ， 
可 以 查看 官方 的 编译 器 之 书号 。 
NELEL 目 前 可 以 改善 的 问题 
Rust 2018 版 本 默认 文 持 了 NLL。 前 面 代码 清单 5-60 中 的 问题 在 Rust 
2018 版 本 中 将 不 复 存 在 。 并 且 NLL 可 以 识别 一 些 常见 的 使 用 场景 ， 如 代 
码 清单 5-63 所 示 。 
代码 清单 5-63: NLL 示 例 之 一 
l. fn capitalize(data: &mut [char]) { 
// do something 
} 
fn foo() 4 
let mut. data = vec! ['a", "DT, *ce"ls 
let slice = &mut datal[..]; 
capitalize (slice); 
8. data.push ("d")? 
9. } 
10. fn main() {} 
在 代码 清单 5-63 的 第 2 行 中 ， 我 们 定义 了 可 变 切 放 slice， 然 后 将 其 传 
给 了 capitalize 函 数 ， 在 capitalize 国 数 执行 完毕 后 ， 理 论 上 残 没 有 需要 使 
用 可 变 借用 &mut data 的 地 方 了 ， 应 该 不 会 影 啊 后面 的 push 操 作 。 但 古 因 
为 当前 借用 检查 是 基于 词法 作用 域 的 ，&mut data 的 生命 周期 家 认为 是 
独占 了 foo 函 数 整 个 作用 域 范围 的 ， 所 以 当 data 调 用 push 方 法 并 需要 可 弯 
信用 的 时 候 ， 违 反 了 信用 规则 。 
在 选择 Rust 2018 版 本 之 后 ， 代 码 清单 5-63 将 正 钊 编 详 通过 ， 这 应 该 
J FRF RE N EDE o 
再 来 看 NLEL 另 外 一 个 示例 ， 如 代码 清单 5-64 所 示 。 
代码 清单 5-64: NLL 示 例 之 二 


“I ovo ds WW N 


StELrUCE ELSES 4 
vVaLue: T, 
next: Optcion<Box<List<To>>, 
} 
fn. CO tetse<t>(tiit ILSET sur. LISESI?) -2 Vec<amat I> 1 


‘Oo Oo =] OF Oo] & G PO FF 


let mut result = vec! []; 
loop { 
result.push(&mut list.value) ; 
LE let. Some Gi) = last.next.Aas MUE) | 

EEk last = ny 
LL } else { 
IZ. return result; 
L3. } 
14. } 
lòs ł 


16. Tn. Mant) 43 

在 代码 清单 5-64 中 ， 在 一 个 loop 循 环 中 使 用 了 可 变 借 用 &mnut 
list,value， 当 前 的 借用 检查 器 会 认为 这 个 可 变 借用 是 多 次 借用 ， 从 而 编 
译 报错 。 在 使 用 Rust 2018 版 本 时 ， 该 代码 能 够 正常 编译 通过 。 也 束 是 说 
NLL 也 解决 了 无 限 循 环 中 借用 检查 的 问题 。 

当然 ，NLL 目 前 还 有 未 解决 的 问题 ， 如 代码 清 蛙 5-65 所 示 。 

代码 清单 5-65: NLL 示 例 之 三 


L. fn main() { 

2. let mut x = vec! [1]; 

CA x.push(x.pop().unwrap()); 
a. } 


代码 清单 5-65 中 的 写法 并 不 被 NLL 支 持 。NLL 不 仅 改 进 了 借用 检查 
癸 ， 还 提升 了 错误 提示 的 精准 度 。 根 据 预 息 ， 代 但 清 单 5-65 将 会 报 如 下 


ae 


error[E0506]: cannot write to x 


| x.push(x.pop().unwrap()); 


while borrowed 
a NINA NIAAA AA AAARA 0&4 


| 
| | | write to x occurs here, while borrow is still in active use 
| | borrow is later used here, during the call 


| ‘x borrowed here 
当然 ， 目 前 的 错误 提示 还 不 是 这 样 的 。 官 方 团 队 正 在 努力 完善 
NLL， 未 来 的 错误 提示 将 会 像 上 面 的 摘 述 这 样 精准 。 


5.9 小 结 


本 章 依旧 从 内 存 管 理 出 及 ， 逐 步 探 索 了 Rust 中 的 重要 概念 : 所有权 
系统 。Rust 中 的 每 个 值 都 有 一 个 唯一 的 所 有 者 ， 只 有 所 有 者 才 有 权力 对 
资源 进行 有 效 访 问 和 和 释放。 所有权 的 压 层 实现 体现 了 Rust 对 内 存 或 资源 
的 精细 控制 能 力 。Rust 通 过 Copy 标 记 trait， 将 传统 的 值 语义 和 引用 语义 
类 型 做 了 精确 的 划分 ， 并 且 将 值 语义 和 引用 语义 纳入 了 所 有 权 系 统 中 ， 
产生 了 新 的 语义 : 复制 语义 和 移动 语义 。 并 且 这 两 种 语义 都 是 在 编 详 项 
严格 检查 下 执行 的 ， 以 此 来 保证 内 存 安全 。 

Rust 也 人 允许 将 所 有 权 进 行 短 叔 租 倍 。 但 是 租 倍 所 有 权 需 要 满足 一 个 
核心 原则 : 共 娃 不 可 变 ， 可 变 不 共 圣 。 世 就 是 说 ， 在 同一 个 词法 作用 域 
H, ANIA WSR Sik, MAAR AEH ik. 5A, (8 
FA AIAN FE 28 TR, in PES PY fe A ar a 2 En ET fi 
VA MEET Bark, WOE GR HESS ET HY BSB 

2 Eas HY fis H on ANLE DOT Ss RIA fe a Te, KAANE 
FA CE ORG TTA VE A a, WAFER, TTP AR aR 
Ato MA, MENRE ie SUH HE m HS BT ie. Ef JA 
HAZ BUR TE E — JU EA OR a EAD 的 生命 周期 必须 不 能 长 
于 输入 (出 借方 的 生命 周期 。Rust 内 部 也 便 编码 了 一 些 模式 来 实现 自 
动 付 亨 生 命 周 期 参数 ， 这 些 模式 个 称 为 生命 周期 省 略 规 则 ， 但 是 生命 周 
期 省 略 规 则 不 同 于 类 型 推 有 新， 适用 的 情况 比较 有 限 ， 在 无 法 推 邮 生命 周 
期 的 情况 下 ， 编 译 右 会 报错 ， 此 时 束 必 须 显 式 地 添加 生命 周期 参数 。 妆 
然 ，Rust 官 方 团队 正在 努力 改进 生命 周期 省 略 规则 ， 以 减少 需要 显 式 地 
标注 生命 周期 参数 的 情况 ， 也 在 通过 引入 非 词 法 作用 域 生 命 周 期 (Non 
Lexical Lifetime) 来 改进 函数 本 地 对 借用 的 生命 周期 推 师 。 

除了 普通 的 引用 ，Rust 还 引入 了 智能 指针 来 帮助 开发 者 处 理 一 些 场 
景 。 比 如 引用 计数 智能 指针 Rc<T> 可 以 共享 所 有 权 ， 方 便 在 需要 多 个 
变量 证 取 资 源 但 不 想 转 移 或 倍 用 所 有 权 的 情况 下 使 用 。 同 时 ，Rust 也 所 
供 了 Rc<T> 的 弱 引 用 版 本 weak<T> ， 来 帮助 消除 循环 引用 情况 下 引 
起 的 内 存 泄 漏 。 除 此 之 外 ，Rust 还 提供 了 内 部 可 变 容器 Cell<T 之 和 
RefCell<T>， 使 用 内 部 可 杰 容 句 可 以 对 不 可 变 的 结构 体 字 段 进 行 修 


Ml, MWEE mR. Rutt sede KASNE tll A Cow<T> A 
aa, DADA RA a> Bill, EERE, FA KYE 

本 章 还 简单 介绍 了 上 所有权 在 保证 并 发 安全 中 的 重要 作用 ， 并 罗列 了 
Rust 提 供 的 一 些 用 于 线程 同步 的 和 留 能 指针 类 型 ， 在 后 面 的 章 市 中 将 介绍 
更 详细 的 内 容 。 

最 后 介绍 了 Rust 2018 版本 中 的 非 词 法 作用 域 生 命 周 期 CNLL) ， 
介绍 了 其 工作 原理 ， 并 用 通过 示例 展示 了 NLL 对 开发 者 编写 Rust 代 三 的 
体验 帝 来 的 提升 。 同 时 指明 ， 目 前 NLEL 还 未 完善 ， 期 待 官方 的 进一步 改 
Die 

所 有 权 系 统 是 Rust 的 核心 ， 可 以 说 掌握 了 了 所有权 系统 ， 就 等 于 掌握 
J Rust. 





[1] https://github.com/rust-lang/rfcs/blob/master/text/2094-nll.md 


[2] https://rust-lang-nursery.github.io/rustc-guide/mir/index.html 


第 6 章 KA WEBERA 


语言 影响 或 决定 人 类 的 思维 方式 。 

Rust 坪 一 门 混 合 范 陈 的 编程 语言 ， 有 机 地 融合 了 面 同 对 象 、 函 数 陈 
和 汉 型 编程 范式 。 所 并非 将 这 些 特性 进行 简单 堆砌 ， 而 是 通过 高 度 一 致 
性 的 类 型 系统 融合 了 这 三 种 范式 的 编程 思想 。 可 以 通过 impl 关 键 字 配合 
结构 体 和 trait 来 实现 面 回 对象 范 式 中 的 多 态 和 封 荫 ， 也 可 以 通过 函数 、 
融 阶 函数 、 闭 包 、 模 却 匹 配 来 实现 函数 式 范 式 中 的 一 些 编程 工具 。Rust 
文 持 零 成 本 廊 态 分 友 的 泛 型 编程 ， 并 且 将 它 很 好 地 融入 了 其 他 两 种 编程 
江 式 中 ， 提 供 了 更 局 的 抽象 层次 。 通 过 将 这 三 种 编程 沁 式 完美 融合 起 
来 ，Rust 语 言 拥 有 了 更 高 程度 的 抽象 以 及 更 强 的 表达 能 

函数 式 语言 的 历史 要 比 面 癌 对 象 语言 您 入 ， 它 源 自古 老 的 LISP if 
襄 ， 其 后 友 明 的 语言 或 多 或 少 部 受到 了 孙 数 式 编 程 思 想 的 有 影 啊 ， 比 如 
Python, Ruby, DIXA WAHI RŽ i A Haskel. PÆ EIKER RZ, 
CPU 性 能 的 提升 转 为 主要 依赖 核 数 的 增加 ， 多 核 时 代 到 来 后 ， 函 数 式 编 
程 因为 其 天 生 对 并 友 友 好 的 特性 又 逐渐 受到 了 重视 。 所 以 近年 来 很 多 新 
诞生 的 语言 也 吸收 了 函数 式 范 式 的 诸多 特性 ， 比 如 Elixir、Scala、Swift 
都 受到 了 LISP 和 Haskell 的 影响 ， 对 代数 数据 类 型 Calgebraic data 
type) ~ RAME mAN HEARRE LI. EPEE 
久远 的 主流 语言 ， 比 如 C++ 和 Java 也 都 开始 吸收 函数 式 语 言 的 特性 。 
Rust 作 为 一 门 在 多 核 时 代 诞 生 的 现代 编程 语言 ， 引 入 机 数 式 编程 范式 完 
全 是 顺势 而 为 的 。 

本 章 内 容 主 要 从 函数 和 财 包 两 个 方面 来 探讨 Rust 对 函数 式 编程 沁 式 
WSC HR, KB UAT as AcE LAY DY o 


6.1 函数 


对 于 一 些 重 复 执行 的 代码 ， 可 以 将 其 定义 为 一 个 函数 ， 方 便 调 用 。 
在 第 2 章 我 们 已 经 了 解 到 ， 可 以 使 用 和 关键 字 来 定义 函数 。 一 个 标准 的 
图 数 定 义 如 代码 清单 6-1 所 示 。 

Sis 26-1: 函数 定义 示例 


1. // 函数 定义 形式 
2 
3， /* BRK / 
4. |} 
5. // 利用 Raw identifier Fi E XRF BAS (Rust 2018 版 本 ) 
6. fn r#match(needle: &str, haystack: &str) -> bool { 
Vs haystack.contains (needle) 
Sy J 
oe 

10, En feame) { 

Li a assert! (r#match ("Ioo", "foobar" }; 

lég J 


如 代码 清单 6-1 Aran, fn KES ANKE PK, Wa UREJE at 4 
法 (snake case ) MZ, CURARSE. RAA AU ZH A 
地 指定 类 型 ， 如 果 有 返回 值 也 必须 指定 返回 值 的 类 型 。 需 要 注意 有 的 是 ， 
Rust 中 的 函数 参数 不 能 指定 默认 值 。 函 数 体 被 包含 于 花 括 写 之 内 ， 除 函 
数 体 之 外 的 函数 声明 被 称 为 函数 签名 ”。 可 以 说 ,一 个 函数 是 由 函数 签 
名 和 函数 体 组 合 而 成 的 。 

一 般 来 说 ， 函 数 定义 时 不 允许 直接 使 用 语言 中 的 保留 字 和 关键 字 等 
作为 函数 名 。 但 是 在 Rust 2018 版 本 中 ， 通 过 将 原生 标识 操作 符 (Raw 
Identifier) r# ”作为 前 级 ， 即 可 使 用 关键 字 为 水 数 命 名 ， 访 语法 一 般 用 
于 FFI 中 ， 用 于 避免 C 函 数 名 和 Rust 的 关键 字 或 保留 字 重 名 而 引起 的 冲 
突 ， 如 代码 清单 6-1 的 第 6 行 所 示 。 

通过 前 面 的 划 届 我 们 了 解 到 ， 也 数 参 数 可 以 按 值 传递 ， 也 可 以 按 引 
用 传递 。 当 参数 按 值 传递 时 ， 会 转移 所 有 权 或 者 执行 复制 (Copy) iH 


义 。 当 参数 按 引 用 传递 时 ， 所 有 权 不 会 友 生 变化 ， 但 是 需要 有 生命 周期 
参数 。 当 符合 生命 周期 参数 省 略 规则 时 ， 编 详 希 可 以 通过 目 动 推 凑 人 补 齐 
图 数 参数 的 生命 周期 参数 ， 合 则 ， 和 需要 显 式 地 为 参数 标明 生命 周期 参 
数 。 

因数 参数 也 分 为 可 变 和 不 可 变 。Rnust 的 函数 参数 默认 不 可 变 ， 当 需 
要 可 变 操作 的 时 候 ， 需 要 使 用 mut 关 键 字 来 修饰 。 代 人 码 清单 6-2 展 示 了 当 
BBE eA iE A mut ta o 

代码 清单 6-2: 按 值 传递 的 参数 使 用 mut 关 键 字 


le ER ModLiE (Mae. VE VeecusZz>) => Veecus2> 1 


Zt v¥.push (42) ¥ 

Su V 

4. } 

Ss En. Main() 4 

Ss let v = vec! [1,2,3]; 
Ta let v = modify (v); 
8. DELNCILAL CU" Ligh Wi 
Fa } 


代码 清单 6-2 定 义 了 modify 函 数 ， 以 对 传 入 其 中 的 动态 数组 进行 修 
改 ， 所 以 需要 其 参数 为 可 变 的 。main 函 数 的 第 6 行 声明 的 变量 绑 定 v 是 
Vec<u32 之 类 型 ， 将 其 传 到 modify 中 ， 它 的 所 有 权 会 被 转移 。 对 于 第 1 
行 的 modify 函 数 来 说 ， 参 数 相当 于 重新 声明 的 另 一 个 变量 绑 定 ， mut 关 
键 字 被 放 到 参数 变量 前 面 作为 可 变 修饰 。 所 以 ， 在 main 函 数 中 ， 声 明 v 
的 时 候 并 没有 使 用 mut 关 键 字 。 

代码 清单 6-3 展 示 了 按 引 用 传递 参数 时 mut 的 用 法 。 

代码 清单 6-3， 按 引用 传递 参数 时 的 mut 用 法 


En modity(v: mut [usZz)]) 4 
v.reverse(); 

} 

fn main(){ 
let mut v = vec![1,2,3]; 
modify(&mut v) z 
erin las" Li? Lb Be L 


Own :GY OF = W N H 


e ¥ 

代码 痛 里 6-3 中 的 modify 函 数 参 数 本 里 已 经 是 可 变 引 用 类 型 &mut 
[u32]， 所 以 此 处 的 函数 参数 前 面 不 需要 再 使 用 mut 关键 字 。 在 main K 
AUR, WRAPS ” 行 声 明 的 变量 绑 定 Vv 作为 可 变 引 用 参数 ， 束 必须 使 
用 mut 关 键 子 来 将 其 声明 为 可 变 变 量 。 


6.1.1 pe AAC FF Mk 


SPAWAR ee EZ Ja, WR Pe A Ae E,W ZS 
ER TE 2 OM ENT, TAUPE AR ae BEI Cvariable shadow) . 2s AJ LAUH 
此 ， 但 函数 不 能 被 多 次 定义 。 假 如 代码 请 单 6-3 中 的 modify 函 数 家 定义 
BIR, MERAM F TER: 

error[E0428]: the name “modify is defined multiple times 

FY VAR IT E SSH 188 H EE FT] 24 YY R Bop Bs BU) AS Ted A EF 
OES as LAN ets That, FER) — MER BC AEE M&S 
APRA, AER UY RE SA ES BE FRA AC SR RC TE A 
外 的 同名 函数 ， 如 代码 清单 6-4 所 示 。 

代 但 清单 6-4: 作用 域内 的 函数 会 屏蔽 挥 作用 域外 的 同名 函数 


en EO t Peane! (MLE | 
fn main) { 
Ee Ji 2 
{ 
EJF Jf 3 
fn f(y T print! ("Ss") | 
} 
Cop: Jf 2 
fn f() { print! ("2"); } 
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WO 


Lop 了 
代码 清单 6-4 的 输出 结果 为 232。 在 main 函 数 第 9 行 定义 的 函数 f 屏 菩 
了 main 函 数 外 定义 的 函数 f， 所 以 第 3 行 和 第 8 行 会 输出 2。 第 6 行 定 义 的 
函数 f 则 屏蔽 了 main 函 数 中 定义 的 函数 {， 所 以 第 5 行 会 输出 3。 
6.1.2 函数 参数 模式 匹配 


国 数 中 的 参数 等 价 于 一 个 隐 式 的 let 绑 定 ， 而 let 绑 定 本 身 是 一 个 模式 
匹配 的 行为 。 所 以 函数 参数 也 文 持 蛋 式 匹配 ， 如 代码 清单 6-5 所 示 。 
(USS 6-5: 函数 参数 文 持 模式 匹配 


1. #[derive (Debug) ] 


2 struct 5 { az 4232 7 

a Pn DTiESE Gi 2) i 

4 printin! ("{:p}", _s)s //0x7ffddi36é4bs0 
Die } 

6 in main) { 

7 let eg =S 4 te 4 H 

8 EISI? 

9 人 

LO: 4 


代码 清单 6-5 中 定义 了 图 数 f， 其 参数 使 用 ref 关 键 字 来 修饰 ， 这 和 意味 
看 要 使 用 模式 L 配 来 获取 参数 的 不 可 释 引 用 。 与 ref 相 对 的 是 ref mut, ref 
mut 用 来 下 配 可 变 引 用 。 所 以 ， 代 人 码 第 4 行 才 可 以 通过 " {: p} "来 打印 
目 针 地 址 。 但 是 main 国 数 中 作为 参数 传递 的 蕉 量 绑 定 s 的 所 有 权 会 被 转 


移 。 

除了 ref 和 ref mut， 畏 数 参 数 也 可 以 使 用 通配符 来 忽略 参数 ， 如 代码 
清单 6-6 所 示 。 

代码 清单 6-6: 使 用 通配符 忽略 参数 


1 fH foot i 132) 4 
2 // 

oy } 

4 fn main() { 

5 TOO (3) 

6 } 


实现 菏 个 trait 中 的 方法 时 ， 有 时 并 不 会 用 a 到 其 函数 签名 中 声明 的 所 
有 参数 ， 这 时 可 以 使 用 通配符 来 进行 忽略 ， 这 样 不 会 引起 编译 错误 。 
Rust 中 的 let 语句 可 以 通过 模式 罗 配 解构 元 组 (Tuple〉， 了 负数 参数 
也 可 以 ， 如 代码 清单 6-7 有 所 示 。 
代码 清单 6-7: 函数 参数 利用 模式 匹配 来 解构 元 组 
由 
2 (Y, xX) 
3 } 
4. fn main() { 
5 let t = ("Alex", 18); 
6 let t = swap(t); 
Ta assert eqi(t, (18, “Alex™)}; 
Ga } 
在 代码 清单 6-7 中 ， 函 数 swap 的 参数 利用 了 模式 匹配 来 解构 元 组 ， 
当然 ， 如 果 只 想 解 构 元 组 中 的 时 个 值 ， 则 使 用 通配符 将 其 他 值 忽 略 挥 即 
可 。 


6.1.3 PA ACK [FB 
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数 ， 其 实 也 相当 于 返回 了 一 个 单元 值 ()  。 如 果 需 要 返回 多 个 值 ， 亦 
可 使 用 元 组 次 型 ， 如 代码 清单 6-8 所 示 。 


代码 清单 6-8: 使 用 元 组 类 型 让 函数 返回 多 个 值 
1 fn adadsub (x: 18126, yI 18326) => (425126, 15126) 4 
Z x + wy, a= yj 
3 } 
4. fn main() { 
5 let (a, b) = addsub(5, 8); 
6 orinel ("at [ie he BE LSE": Be W3 
Ge d 

代码 清单 6-8 中 的 addsub 函 数 返 回 了 元 组 类 型 ，main 函 数 中 使 用 let 醒 
却 匹 配 解构 了 返回 的 元 组 ， 分 别 声明 了 变量 绑 定 a 和 b。 

Rust 语 言 提 供 了 return 天 键 字 来 返回 函数 中 的 值 。 对 于 只 需要 返回 
图 数 体 最 后 一 行 表达 陈 所 求 信 的 函数 ，return 可 以 和 省略 ， 比 如 addsub 函 
数 。 在 茶 些 控制 结构 中 ， 比 如 循环 或 条 件 分 文 ， 如 采 需 要 提前 退出 函数 
并 返回 某 些 值 ， 则 需要 显 式 地 使 用 return 天 键 字 来 返回 ， 如 代码 清早 6-9 
所 示 。 

代码 清单 6-9: 使 用 return 提 前 返回 示例 


Ls EN gcd(a: 2 W22) => U32 í 
Ba if b == 0 { return a; } 

cP return Wy a = Diz 

4. } 

Da Er MLM 

2 let g = gcd(60, 40); 

Ta assert eg: a0; gji 

8 } 


在 代码 清单 6-9 F, PAL ocd EARLE RRR GRAY) 求 
两 数 中 的 最 大 公约 数 。 如 果 a%b 的 余数 不 为 0， 则 将 b 和 a 相 互 置换 ， 将 
余数 作为 b 的 值 ， 继 续 侯 归 求 值 ， 如 果 余 数 为 0， 则 提前 返回 a。 其 实 此 
例 中 如 果 gcd 函 数 使 用 if-else 条 件 分支 ， 阅 读 性 会 更 好 一 些 。 

我 们 在 第 2 章 中 见 到 过 函数 返回 值 类 型 为 “! A AC CRRA 

(diverging function〉， 这 类 函数 将 永远 不 会 有 任何 返回 值 。 


6.1.4 泛 型 函数 


Rust “的 函数 也 支持 泛 型 。 通 过 实现 泛 型 国 数 ， 可 以 节省 很 多 工作 
量 ， 如 代码 清单 6-10 所 示 。 
代码 清单 6-10: SEES AY BOR Bil 


be USS SEAS! OBS s thi. 

Biv bm squares]: Mal VUubpucHiasta: Ty ve TY = 

GM i 

4. } 

ia fn main() { 

ore Let a: 1352 = square(3s/, 4:1)? 

Tu let D: £64 = square(37/.2, 41.1); 

aia assert g! (a, 1517)? 

9 . assert eq! (b, 1528.92); // 浮 点 数 执行 结果 可 能 有 所 差别 
LD tee J 


代码 清单 6-10 实 现 了 一 个 求 平方 的 函数 square， 访 图 数 参数 并 未 指 
定 具 体 的 类 型 ， 而 是 用 了 泛 型 T ， 对 T 只 有 一 个 Mul trait 限 定 ， 即 只 有 实 
现 了 Mul 的 类 型 才 可 以 作为 参数 ， 从 而 你 证 了 类 型 安全 ， 这 是 实现 泛 型 
函数 需要 注意 的 地 方 。 因 为 Mul trait 有 关联 类 型 ， 所 以 这 里 需要 显 式 指 
定 为 Output=T。 这 样 ， 在 main 函 数 中 可 以 将 其 应 用 于 i32 或 f64 等 类 型 ， 
而 不 需要 单独 为 某 个 次 型 实现 一 通 square 男 数 。 
注意 ， 这 里 调用 Square 函数 的 时 候 并 未 指定 具体 医 型 ， 而 是 靠 编 详 
佛 玉 进行 目 动 推断 的 。 此 示例 使 用 的 都 是 基本 原生 类 型 ， 编 译 右 推断 起 
来 比较 人 徐 单 。 但 育 定 存 在 编译 硕 无 法 目 动 推 半 的 情况 ， 此 时 驳 需 要 最 式 
地 指定 函数 调用 的 类 型 ， 需 要 用 到 第 3 章 提 到 过 的 turbofish 操 作 符 : : < 
>， 如 代码 清单 6-11 所 示 。 
代码 清单 6-11: 使 用 turbofish 操 作 符 
La G86 Stas tops :2MuL 
4, En Souare<T: Mul<T, Output = Tere: Ty, ye TY -> p f 


} 
fn main() { 
let a = square: :<u32> (37, 41); 
let b = square::<f32>(37.2, 41.1); 
assert egi iar Lol!) ; 
assert Sot (Ds 152649199) 7 
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10. } 
代码 清单 6-11 的 第 6 行 和 第 7 行使 用 murbofish 操 作 符 指定 了 其 体 的 关 
型 ， 因 而 了 台 不 需要 在 变量 绑 定 a 和 b 之 后 再 次 显 式 地 指定 类 型 了 。 


6.1.5 方法 与 函数 


Rust PHATE AK AA o MAR H HXT REEL, 
在 语义 上 ， 它 代表 菏 个 实例 对 象 的 行为 。 函 数 只 是 一 段 简 单 的 代码 ， 它 
可 以 通过 名 字 来 进行 调用 。 方 法 也 十 通过 名 字 来 进行 调用 的 ， 但 它 必 须 
关联 一 个 方法 接收 者 。 

代码 消 日 6-12 中 为 结构 体 User 实 现 了 方法 。 

Wiis 6-12: 为 结构 体 User 实 现 方 法 


1. #[derive (Debug) ] 

Zw Struct User i 

3% name: &'static str, 

4. avatar url? &*statie str, 

M } 

6. ampi User { 

Ta fn show(&self) { 

B. println! ("name: {:?} ", self.name) ; 
Z. DETER ("“avatari {iz} Te Sselt.avetar TEL) ; 
LD is } 

il d 

lee DH. Mant) 4 

La. let user = User { 

14. name: "Alex", 

Tes avatar url: “https://avatar.com/alex” 
j Ls 

Lae // User::show(&user) 

LS 5 user.show(); 

R P 


代码 清单 6-12 中 定义 了 结构 体 User， 包 含 两 个 成 员 字 段 name 和 
avatar_ul。 我 们 使 用 impl 关 键 字 为 User 实 现 了 show 方 法， 其 参数 为 
&self。 此 处 self 为 结构 体 User 的 任意 实例 ，&self 则 为 实例 的 引用 。 

这 样 就 可 以 在 main 函 数 中 使 用 点 操作 来 调用 show 方 法 了 (代码 第 18 
行 )， 而 结构 体 实例 user 会 航 隐 陈 传 递 给 show 方法 ，user Wize show 
方法 的 接收 者 。user.show 等 价 于 User: : show (&user) 这 样 的 图 数 调 
用 。 在 第 7 章 中 还 会 讲 到 更 多 关于 结构 体 和 方法 的 内 容 。 


6.1.6 高 阶 函 数 


在 数学 和 计算 机 科学 里 均 有 高 阶 图 数 的 定义 。 在 数学 中 ， 高 阶 困 数 
也 叫 算 子 或 汉 图 。 比 如 微 积 分 中 的 导数 束 是 一 个 图 数 到 另 一 个 图 数 的 映 
册 。 在 计算 机 科学 里 ， 高 阶 图 数 是 指 以 图 数 作为 参数 或 返回 值 的 函数 ， 
它 也 是 函数 式 编 程 语言 最 基础 的 特性 。Rust 语 言 也 支持 高 阶 疯 数 ， 因 为 
图 数 在 Rust 中 是 一 等 公民 。 
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图 数 可 以 作为 参数 进行 传递 ， 如 代码 清单 6-13 所 示 。 

代码 清单 6-13: 函数 本 身 作 为 参数 

Eo Mech (oes En (ios. 222) -F 232, AI 2 
op(a, D) 

} 

tn Siutifa: 122, be 132) -> 132 9 
a + B 


} 
nm produet (a> iss D: 132) =F Ta i 


a, ™ p 
} 
> mt ¢ 
let (@ D) = (2p 2): 


assert eq! (math(sum, a, D); 5); 
assert eq! (math (product, a, B), 6); 

} 

代 但 清单 6-13 的 第 1 行 代码 定义 了 函数 math， 其 中 第 一 个 参数 op 类 


型 为 fn9 G32, i32) ->i32， 代 表 其 为 一 个 函数 。 第 4 行 到 第 6 行 定 义 了 一 
个 求 和 函数 sum， 第 7 行 到 第 9 行 定义 了 一 个 求 积 函数 product， 然 后 在 
main 了 钢 数 中 将 sum 和 product 分 别 作 为 参数 传 到 math 中 进行 调用 ， 编 译 运 
行 之 后 得 到 预期 的 值 。 函 数 math 束 是 一 个 高 阶 函 数 ， 注 意 其 在 调用 的 
时 候 传 入 的 只 是 函数 名 。 


实现 这 一 切 的 基础 在 于 Rust 文 持 类 似 C/C++ 语 言 中 的 隙 数 指针 o K 


数 指针 ， 顾 名 思 义 ， 是 指 辣 函数 的 指针 ， 其 值 为 函数 的 地 址 ， 如 代码 清 
单 6-14 所 示 。 


代码 清单 6-14: 函数 指针 


‘i fn hello() { 

2 printlns ("hello function pointer”) > 

3 } 

4 En. Malin) 

ic LEE if Pers CR) = MLLO? 

6 puintini ("{rp}",; te prige // Oedé2bactbsrsd 
7 let other fn = hello; 

8 J} println! ("{:p}", other fn); // 非 函 数 指针 
9 


hello(); 
10. ether fn{); 
Lie fn ptr) 
Les (Let PETI LI? 
Lae | 


代码 消 日 6-14 的 第 5 行 声 明了 一 个 函数 指针 。 这 里 需要 注音 的 地 方 
征 ，let 声 明 必 须 显 式 指定 函数 指针 闫 型 血 () ， 以 及 赋值 使 用 的 是 函数 
名 hello 而 非 带 括 号 的 函数 调用 。 第 6 行 通过 打印 fn_ptr 的 指针 地 址 ， 证 明 
其 为 一 个 函数 指针 。 

代 但 第 7 行 的 let 声 明 并 没有 指定 函数 指针 闫 型 ， 如 于 取 澳 第 8 行 的 许 
释 ， 那 么 编译 此 代码 时 ， 打 印 other 名 指针 地 址 会 报 如 下 错误 : 
error[E0277]: the trait bound ‘fn() {hello}: std::fmt::Pointer’ is not 


satisfied 


8 | println! ("{tipi", other fn); 
| NN The Crait ‘stas: imt: Pointer is net 
implemented for fn() {hello} 


根据 此 错误 信息 可 以 了 解 到 ，other fn 的 类 型 实际 上 是 fn O 
{hello}， 这 其 实 是 函数 hello 本 和 刁 的 类 型 ， 而 非 浮 数 指 针 类 型 ， 所 以 
other_fn 不 是 函数 指针 类 型 。 虽 然 如 此 ， 并 不 会 影响 第 10 行 的 函数 调 
Ho 

| SRS 6-13, pk BomathhyS Mop tse Ain (i32, 
i32) -之 i32， 就 是 函数 指针 类 型 。 当 main 函 数 中 调用 math 函 数 时 ， 传 入 
sum 和 product 枉 数 名 之 后 ， 会 目 动 通过 模式 匹配 转换 为 函数 指针 类 型 。 

对 于 函数 指针 类 型 ， 可 以 使 用 type 关 键 字 为 其 定义 别名 ， 便 于 提升 


代码 可 读 性 ， 如 代码 清单 6-15 所 示 。 
代码 清单 6-15: 使 用 type 关 键 字 定义 函数 指针 类 型 别名 
= 区 


2 fn matutoms MatnOp, at 232, D: 132) => 132] 
3s Grint lal ("1 o"r Cpls 

4 OB (lar D) 

3 } 


当然 ， 也 可 以 将 函数 作为 返回 便 ， 如 代码 请 单 6-16 所 示 。 
代码 清单 6-16: 将 函数 作为 返回 值 


L- type MäthOp = FA(132, 132) => 1323 

2 fn math(op: estr) -> MathOp { 

3 tn suma: 152, BY Ta — TI i 

4. A 5 

es } 

6 tn pro lon tae, Bt Boe) =e da | 

1 arp 

8 

9 match op { 

LD "sum" => sum, 

ils "product" => product, 

12 5 => { 

L3., prantin! ( 

14. "Warning: Not Implemented {:?} oprator, Replace with 
sum", 

L5 op 

16. ) ; 

Led sum 

1B. } 

19. } 


Zi. EA Welt # 


BA is let tay BD) = Ley Sie 

Zo % let sum = math("sum") ; 

24. let product = math("product") ; 
2D a lek div = math ("uiy"); 

AO « assert eq: (sumla,; Dje BS); 

Bla assert. eq! (product (a, Bh 6) 2 
AP assert eq! (div(a, b), 5); 

29 ] 


Sis 426-16 FSB math ear, ZAAFI RENAA PBL 
A Fmatch#t fs VOM, WRF E sum, Wak Esumi ay; WR AFF 
串 是 product， 则 返回 product 函 数 。 注 意 在 match 匹 配 中 ，sum 和 product 
疯 数 均 只 是 函数 指针 (函数 名 ) 。 访 代 但 可 以 正确 编 详 执行 ， 注 意 人 代码 
第 25 行 ， 因 为 没有 实现 div 函 数 ， 所 以 代码 会 打印 指定 的 warning 提 示 ， 
JAE H sum ek) Zr 4 {div AŽ. 

假设 现在 想 把 math 函数 修改 一 下 ， 让 其 作为 返回 值 的 函数 直接 和 
参与 计算 的 人 进行 缚 定 ， 如 代码 清单 6-17 所 示 。 

代码 清单 6-17: 将 返回 的 函数 和 参与 计算 的 参数 直接 绑 定 


Le En SUMA: aoe, D? Loe) =D 242 I 

E a + b 

Fo } 

4. ch BBO (ns 232; Bi 232) — LIS í 
a a * 5 

Gis } 

Ts CVs Mathop = Potisz;, 1382) => Doz 
Bs Ch, Matas Wot BE 132) OF Tee) -> Mathon 4 
9. match op { 

Le a "sum" => suma D); 

Lla _ => product(a; bB) 

LZ a } 

Las 

Iie fm maim{j { 

l3, let (a; D) = (2y 3)? 

16% let sum = math("sum", a, D)? 

Lam 


SIS 6-17 a EAI A OAC eR. EA AE math es SC He FY 
时 候 ，match 匹 配 中 的 sum (a, b) 和 product (a, b) 会 同时 进行 求 值 ， 
得 到 的 是 i 32 类型， 而 不 是 MathOp 类 型 。 所 以 ， 要 想 返 回 函 数 ， 还 必须 
使 用 函数 指针 。 

再 来 看 另外 一 个 将 函数 作为 返回 值 的 示例 ， 如 代码 清单 6-18 所 示 。 

代码 清单 6-18: 返回 堵 认 加 1 的 计数 函数 


1. £En counter() => £n(132) => 132 { 


Bs fn inc (n: 132) => 232 4 

ET n + 1 

da } 

en inc 

Ge J 

Te Fn maint) { 
8 . let £ = counter(); 
a assert eq! (2, £(1)); 


lUe J 


代码 清单 6-18 中 定义 了 默认 加 1 的 计数 函数 ， 现 在 我 们 把 其 改 为 可 
以 直接 指定 增长 值 的 函数 ， 如 代码 清单 6-19 所 示 。 
代码 清单 6-19: 让 counter 函 数 可 以 直接 指定 增长 值 i 


le fñ @eunterti2 152) => £ntis2) => 132 1 
fa fn inen: 132) => 132 4 

Sa n + i 

4. } 

P Ine 

a } 

Tx fn main() { 

Bi. let f = counter (2); 

Da assert eg! (3, f£(1)); 

Los. J 


代码 清单 6-19 编 译 会 报 以 下 错误 : 
error [E0434]: can't capture dynamic environment in a fn item; use the || 
| esa | closure form instead 
Ss | ipi 

h 

Rust AF fn E XAA Zunch PEAS IAG Ces žtcounter) 中 的 变量 
绑 定 i， 因 为 变量 绑 定 i 会 随 厦 栈 巾 的 释放 而 释放 。 如 有 果 一 定 要 这 么 做 ， 
mE HEARRE -o 


6.2 HE 


闭 包 (Closure ) 通 币 是 指 词法 团 包 ， 是 一 个 持 有 外 部 环境 变量 的 
图 数 。 外 部 环境 ”是 指 财 包 定 义 时 所 在 的 词法 作用 域 。 外 部 环境 变量 ， 
在 函数 却 编 程 范 陈 中 也 科 称 为 目 由 变量 ” ， 是 指 并 不 是 在 财 包 内 定义 的 
Se. MAAC SAEN KAM eA Ee 。 

回 到 代码 清单 6-19 中 ， 如 末 想 在 返回 的 函数 中 继续 使 用 变量 i 
需要 用 到 闭 包 ， 如 代码 清单 6-20 所 示 。 

代码 清单 6-20: 返回 闭 包 


1 fn counter(i: 132) => Box<Fn(i32) => i32> { 
2 Box: snew(lmove In: 132| m +1 ) 

EF } 

4 fn main() { 

5 let f = counter (3); 

6 assert eq! (4, £(1)); 


ie } 


FEMS 6-207, counter BOK Ae —-S Ae, DE] y Box<T 
> 中 ， 因 为 财 包 的 大 小 在 编 详 期 是 未 知 的 。 在 Rust 2018 碑 本 中 ， 返 回 的 
闭 包 也 可 以 使 用 impl Trait 语法 与 成 impl Fn (i32) -> 让 2， 这 样 葡 不 需 
di HH Box <T> J. 

在 代码 第 2 行 的 闭 包 In: i32In+i 中 ，i 为 自由 变量 ， 因 为 闭 包 自身 的 
参数 只 有 n。 第 5 间 介 绍 过 闭 包 捕 获 目 由 变量 的 三 种 方式 ， 因 为 此 时 i 为 
复制 语义 类 型 ， 所 以 它 肯 定 会 按 引 用 被 捕获 。 此 引用 会 妨碍 闭 包 作为 消 
数 返 回 值 ， 编 译 占 会 报错 。 所 以 这 里 使 用 move 关键 字 来 把 日 由 变量 i 
的 所 有 权 转 移 到 闭 包 中 ， 当 然 ， 因 为 变量 i 是 复制 语义 ， 所 以 这 里 只 会 
进行 按 位 复制 。 

注意 这 里 闭 包 的 类 型 为 Fn (i32) -> i32 ， 以 大 写字 母 F 开头 的 
Fn 并 不 是 函数 指针 类 型 fn G32) ->i32， 它 是 一 个 trait， 本 章 后 面 的 章 
节 有 更 详细 的 介绍 。 

在 main 疯 数 中 ， 第 5 行 变量 f 绪 定 了 counter (3) 函数 调用 返回 的 闭 


包 。 访 财 包 持 有 counter 图 数 传 入 的 参数 住 3， 在 第 6 行 调用 f《〈1) 时 参与 
计算， 得 到 最 终 的 结 来 4。 

通过 此 例 看 得 出 来 ， 闭 包 包 含 以 下 两 种 特性 : 

延迟 执行 。 返 回 的 财 包 只 有 在 需要 调用 的 时 候 才 会 执行 。 

. 捕获 环境 变量 。 闭 包 会 获取 其 定义 时 所 在 作用 域 中 的 目 由 变量 ， 
以 供 之 后 调用 时 使 用 。 

现在 我 们 对 财 包 有 了 大 致电 了 解 ， 接 下 来 将 系统 地 学 习 Rust 中 团 包 
的 具体 概念 和 实现 。 


6.2.1 团 包 的 基本 语法 


Rust 的 闭 包 语法 形式 参考 了 Ruby 语 言 的 lambda 表 达 式 ， 如 代码 清单 
6-21 所 示 。 
代码 清单 6-21: 闭 包 基本 语法 示例 


le Eñ Maan) 1 

bn ieg ada = |as 232, m asaj] -> 232 | ar bm i 
Ss assert egi facal, óle 27 

4. |} 


MIG Ee Ar CPOE Ales CGA Ss) 组 合 而 
Mo IAT Beh] eB a, Fy MAE A ee a a AB PE TE E SJ Tf 
添加 闫 型 标注 ， 也 可 以 省 略为 以 下 形 去: 


let add = la, DI => 132 4 at D j? 
化 括 与 里 包含 的 古 财 包 函 数 执 行 体 ， 兹 括号 和 返回 值 也 可 以 省 略 : 
let add = |a, bl atb; 


当 闭 包 函 数 疫 有 参数 只 有 捕获 的 目 由 变量 时 ， 稼 道 符 里 的 参数 也 可 
以 省 略 : 
let (a, b) = (1, 2); 
let add = || a+b; 
HERA NEERA, BUS 6-22 ATA 0 
代码 清单 6-22: 闭 包 参数 可 以 为 任意 类 型 


fn val() => 132 { 5 } 

fn main() { 
let adad = |as Tni) => 132, (He Bi) (8) 1) ££ B + Gs 
let r = add(val, (2, 3)); 


assert £0 (FE 107} 


Oo Gh & GW NH 所 


- 5 
代码 清单 6-22 的 第 3 行 定义 的 朵 包 有 两 个 参数 ， 第 一 个 是 函数 指针 
类 型 ， 第 二 个 是 元 组 类 型 。 虽 然 元 组 类 型 中 的 参数 没有 显 式 地 标注 类 
型 ， 但 是 Rust 编 详 带 会 通过 函数 指针 类 型 的 信 筷 来 推 师 其 为 32 类 型 ， 所 
以 代码 可 以 正 第 编 详 运 行 。 

需要 注意 的 是 ， 两 个 定义 一 模 一 样 的 团 包 也 并 不 一定 属于 同一 种 类 
型 ， 如 代码 清单 6-23 所 示 。 
代码 清单 6-23: 两 个 相同 定义 的 团 包 却 不 属于 同一 种 类 型 


i ie fn main() { 

Bi let cl = || {}; 
Ss let c2 = || {}; 
4. let y = lel, zZ} 
Bs } 


代码 清单 6-23 声 明了 两 个 形 陈 一 样 的 财 包 ， 将 它们 保存 到 一 个 数组 
中 。 因 为 数组 只 能 保存 相同 类 型 的 元 系 ， 所 以 编译 会 报 如 下 错 谋 : 
error[E0308]: mismatched types 
g |] let v = [cl, c2]; 


| PFS 


expected closure, found a different closure 


这 表示 两 个 相同 定义 的 财 包 完全 不 属于 同一 种 类 型 。 
6.2.2 AE HJ SEEN 


假如 现在 想 显 式 地 指定 闭 包 的 类 型 ， 访 如何 操 作 ? 可 以 通过 代码 清 
单 6-24 所 示 的 方法 来 查看 一 个 闭 包 的 类 型 。 
代码 清单 6-24: 查看 闭 包 类 型 


1. Eñ Maan) 4 

Be let el è () = || {printin! {mm a elosure”) jg 

Se j 

代码 清单 6-24 编 译 会 报 如 下 错误 : 
error[E0308]: mismatched types 
a || let cl ¥ () = || {println! ("i'm a closure") }; 

| ^AAAAAAAAAAAAAAAAAAAAAAAAAAAAA expected (), found 
closure 
= note: expected type  () 
found type ~[closure@src/main.rs:3:19: 3:49]° 

错误 信息 提示 ， 期 望 得 到 的 类 型 是 单元 类 型 ， 但 是 实际 得 到 的 类 型 
是 [closure@src/main.rs: 3: 19: 3: 49] 。 这 个 闭 包 类 型 与 Rust RHA 
统 提 供 的 第 规 类 型 不 同 ， 它 是 一 个 由 编译 避 制 造 的 临时 存在 的 闭 包 和 实例 
类 型 。 

其 实在 Rust 中 ， 闭 包 是 一 种 语法 糖 ”。 也 吏 是 说 ， 财 包 不 属于 Rust 
语言 提供 的 基本 语法 要 系 ， 而 是 在 基本 语法 功能 之 上 义 提 供 的 一 层 方便 
开 友 者 编程 的 语法 。 闭 包 和 普通 函数 的 错 别 束 是 闭 包 可 以 捕获 环境 中 的 
目 由 变量 。 如 果 用 现在 已 经 学 过 的 知识 来 实现 一 个 目 己 的 团 包 ， 该 如何 
做 ? 

能 想到 的 第 一 个 办 法 是 使 用 指针 。 如 图 6-1 所 示 ， 闭 包 ||{a+b} 的 实现 
可 以 通过 函数 指针 和 捕获 变量 指针 组 合 来 实现 。 指 针 放 栈 上 ， 捕 获 变 量 
放 到 堆 上 。 实 际 上 ， 早 期 的 Rust 版 本 实现 团 包 束 采 用 了 类 似 的 方式 ， 
为 要 把 闭 包 捕获 变量 放 到 堆 上 ， 所 以 称 其 为 疙 箱 (Boxed ) HI 。 这 
种 方式 带 来 的 问题 就 是 影响 性 能 。Rust 是 基于 LLVM 的 语言 ， 这 种 闭 包 
实现 方式 使 得 LLVM 难 以 对 其 进行 内 联 和 优化 。 


|| { a+b} 


fn pointer captured variables pointer 





图 6-1: 使 用 指针 实现 财 包 
所 以 ，Rust 团 队 驻 对 闭 包 的 实现 做 了 重大 改进 ， 也 束 是 当前 版 本 中 
WAEA. METRIEM (Unboxed) WA, WIRE 
Rust 语 言 一 致 性 的 再 一 次 体现 。 
非 妆 箱 闭 包 方 案 有 三 个 目标 : 
可 以 让 用 户 更 好 地 控制 优化 。 
文本 财 包 鬼 值 和 按 引 用 绑 定 环境 变量 。 
文 持 三 种 不 同 的 财 包 访问 ， 对 应 self、&self 和 &mut self 三 种 方 
ie 
实现 这 三 个 目标 的 核心 思想 是 ， 通 过 增加 trait 将 函数 调用 变 为 可 重 
载 的 操作 符 。 比 如 ， 将 a Cb, co d 这 种 函数 调用 变 为 如 下 形式 : 
Fae caL isa; ie Ge OF) 
FnMut::call mut(émut a, (5; Gy 0J) 
FnOnce:scall oncela, (Ð; Cc, a)) 


Rust 增 加 的 这 三 个 trait 分 别 就 是 Fn、FnMut 和 FnOnce。 它 们 在 Rust 
源码 中 的 定义 如 代码 清单 6-25 所 示 。 
代 公 清单 6-25: Fn、FnMu、FnOnce 在 源码 中 的 定义 示例 


1. #[lang = "fn once"] 

2. PEGE paren sugar’ 

3. [fundamental] 

4. pub trait FnOnce<Args> { 

Te type Output; 

Gi. extern "fust-call” in Call Once (BELI, args: Arges) —> SALT i SOUcpiur; 
ten | 

8. #[lang = "fn mut") 

9. #[rustc paren sugar] 

10. #{fundamental] 

11. pub trait FnMut<Args>: FnOnce<Args> { 

12 extern "rust-call” Im Call MUL(amut BELL, dards: Args) 

L5. -> Self::Output; 

14. } 

13. Filago = "ia" | 

16. #[rustc paren sugar] 

17. #{[fundamental] 

18. pub trait Fn<Args>: FnMut<Args> { 

19 extern "rust-call” In call(&selt, args: Args) -> Selts: Output; 
1 


从 代码 清单 6-25 中 看 得 出 来 ， 这 三 个 trait 都 标记 了 三 个 相同 的 属 
性 。 

第 一 个 属性 是 #[lang= "fn/fn_mut/fn_once"] ， 表 示 其 属于 语言 
项 (Lang Item) ， 分 别 以 nm ~ fn mut 、fn_once 名 称 来 查找 这 三 个 
trait. 

第 二 个 属性 是 #[rustc_paren_sugar] ， 表 示 这 三 个 trait 是 对 括号 调 
用 语法 的 特殊 处 理 ， 在 编 详 医 内 部 进行 区 型 检查 的 时 候 ， 仅 会 将 最 外 层 
为 圆 括号 的 情况 识别 为 方法 调用 。 在 类 型 签名 或 方法 签名 中 有 时 候 有 尖 
tes, LKQ<F: Fn (u8, u8) ->u8> , MINAS BRS et 
不 会 被 识别 为 方法 调用 。 

第 三 个 属性 为 并 [fundamentall ” ， 在 第 3 重 介 绍 过 ， 这 是 为 了 文 持 
trait 一 致 性 而 增加 的 属性 ， 加 上 此 属性 则 被 允许 为 Box<T > 实现 指定 的 
trait， 在 此 例 中 是 这 三 个 Fn 系列 的 trait。 


ee Ayal FATT A Heap MK = trait? 这 和 所 有 权 系 统 有 天 。 

FnOnce 调 用 参数 为 self， 这 意味 看 它 会 转移 方法 接收 者 的 所 有 权 。 
换 句 话说 ， 束 是 这 种 方法 调用 只 能 被 调用 一 次 。 

”FEnMnut 调 用 参数 为 &mnut self， 这 和 意味 看 它 会 对 方法 接收 者 进行 可 
ARE FA o 

Fn 调用 参数 为 &self， 这 意味 着 它 会 对 方法 接收 者 进行 不 可 变 借 

用 ， 也 就 是 说 ， 这 种 方法 调用 可 以 被 调用 多 炊 。 

现在 函数 调用 被 抽象 成 为 了 三 个 trait， 实 现 闭 包 就 简单 了 ， 只 再 要 
用 结构 体 代 将 闭 包 表 达 式 ， 然 后 按 有 具体 的 需求 为 此 结构 体 实 现 对 应 的 
trait 妈 可。 这 样 的 话 ， 每 个 团 包 表达 式 实 际 上 残 是 该 财 包 结构 体 的 具体 
实例 ， 访 结构 体内 部 成 员 可 以 存储 财 包 捕获 的 变量 ， 然 后 在 调用 的 时 候 
使 用 即 可 ， 如 代码 清单 6-26 所 示 。 

代码 清 单 6-26: 模拟 编译 项 对 闭 包 的 实现 


(Oo © wl OG CD ce te BQ FO 


NO DN NYO NH NH NH FFF RP RP RP RP RP PP PB 
Om B® w N FO WwW WANA D RA WN FP O 


#! [feature (unboxed closures, fn traits) ] 
struct Closure { 
env var: u3z, 
} 
impl FnOnce<()> for Closure { 
type Output = u32; 
extern “rust-call” tn call once (self; args: ()) => us2 4 
printin! ("call it Fnonce()"); 
S617 .env Var + 2 


} 
impl FnMut<()> for Closure { 
exter “rist-call” in. Gall WEINE self, argé: ()) > faz | 
printin! ("caill at FaMtut()™) 3 
SELL ery yar + 2 


} 
impl Fn<()> for Closure { 
extern “rust-call” tn callléselt, args: ()) => uds2 í 
premmtin! ("call at Fa) i 
SELE., ENY Tar + 2 


} 
fn Gall itr: Poi) -> w323 (fi 8E) -> Woe 4 
f () 


ein | 


fle in call it mat<ers EaMut() => ugze(f: mut EJ =» use | 
2s 下 
29. | 


230. En Gall 1E NCEE: FRORCa() -> e> (F1 F) -> Uae f 
GL s f () 


Js J 
335. LA fiend) i 
34. Lat SOV Yar = 1} 
FD » Let mut c = Closure { env var: env var j; 
20% c(); 
Bhs Be CALATE a 
oo EL WE 
ao Ca oneo | () ); 
40. let mat c = Closure { env var: eny var j} 
41. { 
42. assert. eq! (3, Gall it(se)); 
43. } 
44. { 
45. assert Sai (3; Gall IC Mk (NL ¢))% 
46. } 
47). { 
48. assert egi (3, call 1E once(c)); 
49. } 
ES j 
代码 请 单 6-26 的 第 1 行使 用 了 feature 特 性 #! 
[feature (unboxed closures, fn traits) ] ， 注 意 此 特性 只 能 应 用 于 
Nightly 版 本 下 。 


第 2 行 定 义 了 结构 体 Closure， 有 一 个 成 员 字 段 代 表 从 环境 中 捕获 的 
自由 变量 。 然 后 分 别 为 其 实现 了 FnOnce、FnMut、Fn 这 三 个 trait。 

第 24 行 到 第 32 行 定义 了 call it. call it mut, call it once= ^^y? #! K 
数 ， 它 们 分 别 使 用 FnOnce、EFEnMut、Fn 这 三 个 trait 来 做 泛 型 参数 的 限 
定 ， 用 来 测试 Closure 结 构 体 实例 调用 。 


在 main 函 数 中 ， 第 35 行 定义 了 Closure 结 构 体 实例 ， 将 环境 变量 
eny_Var 体 存在 其 成 员 字 段 中 。 因 为 该 结构 体 实 现 了 指定 的 trait， 所 以 在 
第 36 行 其 实例 c 可 以 像 函 数 那 样 裤 调用 。 

最 终 的 执行 结果 如 代码 清单 6-27 所 示 。 

代码 清单 6-27: 目 定 义 闭 包 实 现 的 输出 结 来 

Le Gall 生 FAH) 
cali at. Fn) 
call at FPoMut() 
call it FnOnce() 
Gall 1t Fa) 
call at. FnMut.() 
. call it FnOnce() 

代码 清单 6-27 第 1 行 是 代码 清单 6-26 中 第 36 行 的 输出 结果 。 它 说 明 ， 
RUA ek eval ce O 是 Fn trait 中 实现 的 call 方 法 。 此 处 结构 体 实例 可 以 
像 函 数 那 样 和 被 调用 ， 这 看 起 来 像 “ 魔 法 ”， 实 际 上 是 由 下 面 的 代码 实现 
的 。 


= oF ao & W WN 


extern “rust=call” in calligselt, args: lll) => waz 


此 处 extern 天 键 字 用 于 fn 前面， 表示 使 用 指定 的 ABI (Application 
Binary Interface， 程 序 二 进 制 接口 ) ， 此 处 代表 指定 使 用 Rust 语 言 的 rust- 
call ABI， 它 的 作用 是 将 函数 参数 中 的 元 组 类 型 做 动态 扩展 ， 以 便 文 持 
可 变 长 参数 。 因 为 在 Fn, FnMut, FnOnce 这 三 个 trait 里 的 方法 要 接收 
闭 包 的 参数 ， 而 编 诺 硕 本 喘 并 不 可 能 知道 开发 者 给 财 包 议定 的 参数 个 
数 ， 所 以 这 里 只 能 传 元 组 ， 然 后 由 rust-call ABI 在 撒 层 做 动态 扩展 。 

但 是 需要 注意 的 是 ， 如 果 想 使 用 rust-call ABI， 必 须 像 代码 清单 6- 
26 第 1 行 那样 声明 unboxed_closures 特 性 。 

代 人 码 清 时 6-26 第 37 行 全 第 39 行 分 列 显 式 地 调用 了 相应 的 call、 
call _mut、call_once 方 法 ， 但 是 注意 必须 显 式 地 指定 一 个 单元 值 为 参 
数 ， 这 里 为 了 演示 ， 指 定 了 args 参 数 为 单元 类 型 。 分 别 输 出 代码 清单 6- 
27 的 第 2 行 至 第 4 行 的 结 

代码 清单 6-26 的 第 40 行 重新 声明 了 Closure 结 构 体 实例 ， 这 是 因为 在 
第 39 行 call_once 调 用 之 后 ， 之 前 的 实例 c 的 所 有 权 人 被 转移 ， 无 法 再 次 被 
使 用 。 要 注意 call_once 方 法 中 的 参数 是 self。 


代码 清单 6-26 的 第 41 行 到 第 49 行 使 用 了 call it、call it_mut、 
call it _ once 函数 来 测试 相应 的 trait 限 定 ， 对 应 的 trait 限 定 如 下 。 


Fè: Fn() => u32 
Fs FnMut() -> u32 
Ft FnOnce() => u32 


输出 的 结果 为 代码 清单 6-27 的 第 5 行 至 第 7 行 ， 和 预期 相符 。 
代码 清单 6-26 等 价 于 下 面 的 团 包 代码 ， 如 代码 清 蛙 6-28 所 示 。 
代码 清 单 6-28: 与 代码 清单 6-26 等 价 的 团 包 示 例 

1 fñ main.) { 

2 let env var = LF 
ce let ¢ = || eny var + 2; 
4 


assert go {3y wl) 
Ba } 


aia A 6-28 中 定义 的 财 包 c 相当 于 代码 清单 6-26 中 已 经 实现 了 
KA DY. trait 的 结构 体 Closure 的 实例 c。 

代码 清单 6-26 模 拟 的 团 包 实 现 并 不 等 同 于 Rust 编 译 旨 源 人 码 中 真正 的 
闭 包 实现 。 这 里 只 是 做 一 个 思路 的 演示 。 

现在 我 们 知道 了 闭 包 是 基于 trait 的 语法 糖 ， 那 么 就 可 以 通过 使 用 
trait 对 象 来 显 式 地 指定 其 类 型 ， 如 代码 清单 6-29 所 示 。 

代码 清单 6-29: 显 式 指定 闭 包 类 型 


assert GO! (3 a())? 


l- fin main () { 

Ps Let env var = 1? 

CP let ¢ 4 Box<Fn() => 152>= Box:inew(||{ env var F Zili 
4. 

Dis 


} 
代码 清单 6-29 的 第 3 行 显 式 地 指定 了 团 包 的 类 型 为 Box<Fn O -> 
i32 之 ， 访 类 型 为 trait 对 象 ， 此 处 必须 使 用 traity 才 象 。 


6.2.3 闭 包 与 所 有 权 


闭 包 表达 式 会 由 编译 右 日 动 翻 详 为 结构 体 实例 ， 并 为 其 实现 Fn、 
FnMut、EFEnOnce 三 个 trait 中 的 一 个 。 但 是 对 于 开发 者 来 说 ， 如 何 才 能 知 


Hee A ELTA SA H i ES ERAS Strate ? 

前 面 提 到 过 ， 这 三 个 trait 和 有 所 有 权 有 关系 。 更 准确 地 说 ， 这 三 个 
trait 的 作用 如 下 。 

“ Fn ， 表 示 闭 包 以 不 可 变 信 用 的 方式 来 捕获 环境 中 的 目 由 变量 ， 同 
时 也 表示 芒 财 包 没 有 改变 环境 的 能 力 ， 并 且 可 以 多 次 调用 。 对 应 
&self. 

-FnMut ， 表 示 财 包 以 可 变 信用 的 方式 来 捕获 环境 中 的 日 由 变量 ， 
同时 意味 看 该 财 包 有 改变 环境 的 能 力 ， 也 可 以 多 次 调用 。 对 应 &mnut 
self. 

- FnOnce ， 表 示 闭 包 通 过 转移 所 有 权 来 捕获 环境 中 的 目 由 变量 ， 
同时 意味 看 该 财 包 没有 改变 环境 的 能 力 ， 只 能 调用 一 次 ， 因 为 该 财 包 会 
消耗 自身 。 对 应 self。 

第 5 章 讲 所 有 权 系 统 时 ， 对 不 同 坏 十 变量 类 型 介绍 过 闭 包 捕获 其 坏 
卉 变量 的 方式 : 

:对 于 复制 语义 类型， 以 不 可 变 引 用 C&T) 来 进行 捕获 。 

` 对 于 移动 语义 类 型 ， 执 行 移动 语义 ， 转 移 所 有 权 来 进行 捕获 。 

对 于 可 变 绑 定 ， 并 且 在 财 包 中 包 售 对 其 进行 修改 的 操作 ， 则 以 可 
变 引 用 〈&mutT) 来 进行 捕获 。 

也 残 是 说 ， 闭 包 会 根据 环境 变量 的 次 型 来 决定 实现 哪 种 trait。 这 三 

个 trait 的 关系 如 图 6-2 所 示 。 


FnOnce 


FnMut : FnOnce 
Fn : FnMut | 





图 6-2: Fn, FnMut. FnOncez [a] AKA 
儿 6-2 展 示 了 En、EnMut、FEnOnce 三 个 trait 之 闻 的 关系 。EnMut 继 承 


SFnOnce, FnX4k7k fFnMut. XARA, WRBSCHIPn, WYSE 
FnMut 和 FnOnce; 如 果 要 实现 FnMut， 束 必须 实现 FnOnce; 如 果 只 需要 
实现 FnOnce， 残 不 需要 实现 FnMut 和 Fn。 

复制 语义 类 型 目 动 实现 Fn 

相关 代码 如 代码 清单 6-30 所 示 。 

代码 清单 6-30: 复制 语义 类 型 自动 实现 Fn 


i. £m Maan) 1 
2 let s = "hello"; 
oP let g = [|1 printim! ("i 8) fi 
4 oh OB 
S S) F 
6. prantind (i sere. Shy 
7 } 


在 代码 清单 6-30 中 ， 声 明了 变量 绑 定 s 为 字符 串 字 面 量 ， 其 为 复制 
语义 类 型 。 财 包 c 会 按照 不 可 变 引 用 来 捕获 s。 第 4 行 和 第 5 行 代 人 码 两 次 调 
用 闭 包 c， 第 6 行 的 println! 打印 5s， 均 可 以 正常 编译 运行 ， 因 此 就 可 以 做 
出 这 样 的 推理 : 闭 包 c 可 以 两 次 调用 ,说明 编译 器 上 自动 为 团 包 表 达 式 实 
现 的 结构 体 实例 并 未 失去 所 有 权 。 第 6 行 的 println! 语句 会 对 s 进 行 一 次 
不 可 变 借用 ， 这 就 证 明 第 3 行 闭 包 对 s 进 行 了 不 可 变 借用 ， 只 有 不 可 变 借 
用 才 可 以 借用 多 次 。 

综 上 所 述 ， 闭 包 c 默 认 自 动 实现 了 Fn 这 个 trait， 并 且 该 闭 包 以 不 可 变 
借用 捕获 环境 中 的 自由 变量 。 

要 实现 Fn 就 必须 实现 FnMut 和 FnOnce， 所 以 ， 代 码 清单 6-30 中 的 闭 
包 如 果 人 被 编译 占 翻 译 为 匿名 结构 体 和 trait， 那 么 Fn、FnMut、FnOnce 都 
会 被 实现 ， 如 代码 清单 6-31 所 示 。 

代码 清单 6-31: 代码 清单 6-30 中 的 财 包 衫 翻译 为 匿名 结构 体 和 trait 
的 情况 


1. #![feature (unboxed closures, fn traits) ] 

2. struct Closure<'a> { 

Bs env var: &'a u32 

4. } 

5. impl<'a> FnOnce<()> for Closure<'a> { 

6. type Output = (); 

Ts extern “rust-call™ tn call once (self; args: ()) => Q) 1 
BL. printlin! (“iia Selt.env var); 

9 } 

bn J 

11. impl<'a> FnMut<()> for Closure<'a> { 

12. extern “INSt-CaLl” Ta Call mit (Emut geli; AgS Wy -> i) 4 
13. printin! (V {i7}; Bsli. eny war) ; 

14. } 

Lie d 

16. impl<'a> Fn<()> for Closure<'a> { 

a te ge extern “rust-call" fn call(&self, args: ()) -> () { 
18. prantin! ("{:?2}", self.,env var) ; 

19. } 

Pla J 

21. fn main() { 

Ze. let env var = 42; 

As let mut c = Closure{env vars gery var}; 

24. c(); //42 

20 č. Call mut(())% // 42 

26. e.call. once(())s // 42 

Zig 4 


在 代码 清单 6-31 中 ， 闭 包 补 翻译 为 结构 体 Closure<′ a >, WAH 
tra Ae ee xe FN A ARS A EAT RAN, ATO See S| A, TER 
这 里 需要 明确 指定 生命 周期 参数 。 在 ”main 疯 数 的 第 24 行 ， 闭 包 结 构 体 
实例 c 的 调用 操作 默认 是 执行 Fn 实现 中 的 call 方 法 。 因 为 这 里 要 实现 
Fn， 必 须 同 时 实现 FnMut 和 FnOnce， 所 以 第 25 行 和 第 26 行 可 以 显 式 
地 直接 调用 call mut 和 call once 方 法 。 


因此 ， 在 代码 清单 6-30 的 团 包 调用 中 也 可 以 显 式 地 调用 call_mut 和 和 
call_once 方 法 ， 如 代码 清单 6-32 所 示 。 
代码 清单 6-32: 实现 了 Fn 的 闭 包 也 可 以 显 式 调用 call_mut 和 
call _ once 方法 
1. #![feature(fn traits) ] 
2 fn main() { 
S let s = "hello"; 
4. Let mut. o = ||{1 BEINE! (MH e7 5) pi 
oa {J 77 “hello” 
6 et); Jë "hello" 
7 Se.CGall maer JF "helle" 
8 Spall once(())% FI “hello” 
9 . e; // "hella" 
10. printinl("[:7}"; ab: F77 "hello" 
ite d 


ARH 6-32 8 17718 Y H! [feature (fn traits) ] 特性 ， 是 为 
了 显 式 调用 trait 实 现 中 的 call、call_mut、call_once 方 法 ， 如 果 是 默认 的 
闭 包 调用 ， 并 不 需要 此 特性 《比如 代码 清单 6-30) 。 

代码 第 4 行使 用 了 mnut 关 键 字 改 变 了 团 包 的 可 变性 ， 这 是 为 了 调用 
call_maut 方 法 ， 此 方法 需要 可 变 闭 包 。 

代码 第 5 行 默认 的 闭 包 调用 是 Fn 实现 的 call 方 法 。 第 6 行 依然 可 以 再 
UR Wil FA A) Ec. 

代码 第 7 行 显 式 地 调用 了 call_mut 方 法 ， 正 常 输出 结 

代 人 码 第 8 行 显 式 地 调用 了 call_once 方 法 ， 正 党 输出 结果 。 此 时 闭 包 c 
捕获 的 变量 s 上 默认 实现 了 Copy， 因 此 默认 实现 的 FnOnce 也 会 日 动 实现 
Copy。 此 处 调用 call_once 方 法 并 不 会 导致 用 包 c 的 所 有 权 补 转移。 第 9 行 
册 次 调用 财 包 c， 正 第 输出 。 但 是 如 果 闭 包 c 的 捕获 变量 是 移动 语义 ， 那 
么 调用 call_once 束 会 转移 所 有 权 。 

第 10 行 正常 打印 变量 绑 定 s， 证 明 财 包 c 并 没有 人 被 后 面 的 call_mut 和 和 
call_once 调 用 所 影响 ， 闭 包 依 旧 是 按 不 可 变 借用 捕获 的 。 这 也 证 明 财 包 
个 编译 莫 翻 详 为 的 结构 体 是 一 种 固定 的 结构 体 。 


移动 语义 类 型 日 动 实现 FnOnce 
相关 代码 如 代码 清单 6-33 所 示 。 
代码 清单 6-33: 移动 语义 类 型 目 动 实现 EnOnce 


1. fn Maani) { 

rae let s = “hello”.to strang() 3 

ce let c= || s; 

4. oll (OF 

5. // c(); // error: use of moved value: `c` 

6. // printlin! ("{:?}", s}; // error: use of moved value: “gs 
Te 


} 
在 代码 清单 6-33 中 ， 变 量 绑 定 s 为 String， 是 典型 的 移动 语义 类 型 。 
第 5 行 第 二 次 调用 财 包 c 的 时 候 ， 编 诺 出 销 ， 提 示 c 已 经 被 转移 了 所 有 
权 ， 因 而 无 法 使 用 。 而 第 6 行 在 第 4 行 财 包 c 调 用 之 后 ， 也 会 编译 出 错 ， 
提示 s 已 经 钻 转 移 了 所 有 权 而 无 法 使 用 。 综 上 所 述 ， 可 以 做 出 这 样 的 推 
H: 财 包 c 在 第 一 次 调用 时 转移 了 其 上 所有权， 导致 第 二 次 调用 失效 ， 证 
明 其 实现 的 财 包 结构 体 实 例 所 实现 的 trait 方 法 参数 必然 是 self。 足 以 证 明 
该 财 包 实现 的 是 FnOnce。 第 6 行 的 $ 因 为 失去 所 有 权 而 失效 ， 也 足以 证 明 
闭 包 c 夺 走 了 s 的 上 所有权。 

既然 财 包 的 默认 调用 是 FnOnce， 这 也 说 明 ， 编 详 右 翻译 的 财 包 结构 
体 中 记录 捕获 变量 的 成 员 字 段 不 是 引用 类 型 ， 并 有 日 只 实现 FnOnce， 所 
以 ， 肯 定 无 法 显 式 地 调用 call 或 call_mut 方 法 ， 如 代码 清单 6-34 所 示 。 

代码 清单 6-34: 闭 包 只 实现 了 FnOnce， 所 以 无 法 显 式 地 调用 call 和 和 
call mut 方法 


lL. #1 [féature(fn traits) | 

2 fn main() { 

3 ley mit & = ELD ty string (); 

A. Leto = || 5} 

Be c(); 

6 // error: expected a closure that implements the `FnMut` trait, 
7 fy but this closure only implements `FnOnce` 

8 /了 LT 

9 // error: expected a closure that implements the `FnMut` trait, 
10. // but this closure only implements `FnOnce` 

le Il Ceall mati U ly 

12. // œa // error: use of moved value: c 

13. [i printin! ("{:?}", s); // error use of moved value: “s° 

Me i 


代码 清单 6-34 的 第 3 行 声明 闭 包 时 使 用 了 mnut 天 键 字 来 设置 财 包 的 可 
变性 ， 同 样 是 为 了 显 式 调 用 call_mnut。 

闭 包 c 默 认 实 现 了 FnOnce， 上 所 以 代码 第 8 行 和 第 11 行 分 别 显 式 地 调用 
call 和 call_mnut 方 法 时 ， 编 详 需 都 报错 了 ， 并 且 提 示 闭 包 只 实现 了 
FnOnce. 

TES TRASH CRRA, FRA A BCR AT SS 
的 错误 。 这 是 因为 团 包 c 的 捕获 变量 是 String 类 型 ， 它 是 移动 语义 ， 所 以 
在 上 面 第 一 次 调用 闭 包 c 之 后 ， 它 的 所 有 权 已 被 转移 。 

使 用 moiie 关 键 字 目 动 实现 Fn 

Rust 针对 团 包 提供 了 一 个 关键 字 move， 使 用 此 天 键 字 的 作用 是 强 
制 让 闭 包 所 定义 环境 中 的 目 由 变量 转移 到 闭 包 中 ， 如 代码 清单 6-35 所 
不 。 

代码 清单 6-35， 环 境 变量 为 复制 语义 类 型 时 使 用 moiie 关 键 字 


1 fn main() { 

2 let s = "hello"; 

eT let © = move ||{ printlin!("{:?}", s) F 
4 c(); 

7 C(); 

6 PELE EL toe. es 


ee } 

代码 清单 6-35 中 的 变量 绑 定 s 为 复制 语义 类 型 ， 里 然 move 关 键 字 强 
制 执行 ， 但 团 包 捕 获 的 s 执 行 的 对 象 是 复制 语义 后 获取 的 新 变量 。 原 始 
的 s 并 未 失去 所 有 权 。 所 以 整个 代码 可 以 正常 通过 编译 。 由 此 ， 可 以 做 
出 这 样 的 推理 : 财 包 c 可 以 连续 两 次 锌 调用 ， 说 明 编 译 器 目 动 生 成 的 闭 
包 结 构 体 实例 并 未 失去 所 有 权 ， 所 以 肯定 是 &self 和 &mut ”self 中 的 一 
种 。 义 因为 团 包 c 本 时 是 不 可 变 的 ， 所 以 只 存在 &self。 因 为 要 进行 不 可 
变价 用 ， 所 以 必须 使 用 mut 天 键 字 将 c 本 里 修改 为 可 变 。 因 此 ， 该 闭 包 实 
现 的 一 定 是 Fn。 

代码 清单 6-36 展 示 的 是 环境 变量 为 移动 语义 类 型 的 情况 。 

代码 清单 6-36: 环境 变量 为 移动 语义 类 型 时 使 用 moiie 关 键 字 


fn main() { 

2 let s = "hello sto string); 

an let c = move ||{ println! ("{:?}", s) j}; 

is c()? 

9 G); 

6 // printlin! ("{:?}", s}; // error: use of moved value: “s` 
7 } 


代码 清单 6-36 中 的 变量 绑 定 $ 为 移动 语义 类 型 String。 在 使 用 move 天 
键 字 强制 转移 所 有 权 之 后 ， 变 量 s 已 经 无 法 再 次 被 使 用 了 ， 所 以 第 6 行 会 
出 错 。 而 财 包 c 依 然 是 默认 不 可 和 变 的 ， 并 且 可 以 进行 多 次 调用 。 同 理 ， 
该 财 包 实现 的 一 定 是 Fn。 

HSA, move ”关键 字 是 否 只 有 影响 捕获 目 由 变量 的 所 有 权 的 转移 情 
mw, MAZARE? 我 们 来 看 一 下 代码 清单 6-37。 

代码 清单 6-37: moiie 关 键 字 是 个 影 啊 财 包 本 刁 


Le itt BOL BaOnes( Sits FF) 4 Fy } 

2 fn main() { 

3 // 未 使 用 move 

4 let mut x = Q; 

S let indr x = || 3 t= 1} 

6 call(iner wl) 

7 // call(incr x); // ERROR: “incr x` moved in the call above. 
8 // 使 用 move 

9 let mut x = D} 

10 let incr x = move || x +s 1; 

LTs call(incr x); 

Ley dall (MOr x)? 

18, // 对 移动 语义 类 型 使 用 move 

14. let mut x = vec! []; 

1S « let expend x = move || x.push(42); 

LG call(expend x); 

in ae // call(expend x); // ERROR: use of moved value: ‘expend x` 


Low | 

代码 清单 6-37 定 义 了 call 函 数 ， 以 FnOnce () 闭 包 作为 参数 ， 在 函 
数 体 内 执行 团 包 ， 访 函数 主要 用 于 判断 闭 包 目 映 的 所 有 权 是 否 转 移 。 

代码 第 4 行 到 第 7 行 定义 了 闭 包 incr x， 并 未 使 用 move 关 键 字 ， 其 捕 
获 变 量 x 为 复制 语义 。 将 此 闭 包 作为 参数 传 给 cal 函数 调用 两 次 ， 在 第 二 
次 调用 的 时 候 会 报错 ， 提 示 incr_x 所 有 权 已 经 被 转移 。 

RAS OFT BEB 1247 FRR EM SS A incr_x, (AEE S move 
关键 字 。 将 其 作为 参数 传 给 call 函 数 调用 两 次 ， 均 可 正品 编译 执行 。 

代码 第 14 行 到 第 17 行 定义 了 闭 包 expend_x， 使 用 了 move 关 键 字 ， 其 
捕获 变量 x 现 在 为 移动 语义 类 型 。 将 其 作为 参数 传 给 call 国 数 调 用 两 次 ， 
第 二 次 调用 报错 ， 提 示 expend_x 的 所 有 权 已 经 被 转移 。 

通过 代码 清单 6-37 看 得 出 来 ， 闭 包 在 使 用 move 关 键 字 的 时 候 ， 如 果 
捕获 变量 是 复制 语义 类 型 的 ， 则 闭 包 会 日 动 实 现 Copy/Clone; 如 果 捕 获 
变量 是 移动 语义 类 型 的 ， 则 财 包 不 会 目 动 实现 Copy/Clone， 这 也 是 出 于 
你 证 内 存 安全 的 考虑 。 


修改 环境 变量 以 目 动 实现 FnMIut 

很 多 时 候 需 要 通过 修改 环境 变量 的 闭 包 来 自动 实现 FnMut， 如 代码 
清单 6-38 所 示 。 

代码 清单 6-38: 修改 环境 变量 的 财 包 来 目 动 实现 FnMut 


| 

let mut s = “rush".to string(); 

35 { 

4. let mut c = |/{ s t= " rust" }; 

Da C(); 

6. CA)? 

Ty // error: cannot borrow `s` as immutable 
8. // because it is also borrowed as mutable 
9 . A BEINET ("ria Sji 

dL) } 

Iia SEIMEN eke ei r BIG 

lfa J 


代码 清单 6-36 中 的 变量 绑 定 s 使 用 mnut 关 键 字 修 改 了 其 可 变性 ， 成 为 
了 可 变 绑 定 。 变 量 s 通 过 第 4 行 的 闭 包 c 进 行 了 自我 修改 ， 所 以 闭 包 c 在 声 
明 时 也 使 用 了 了 mut 关键 字 。 如 末 想 修改 环境 变量 ， 必 须 实现 FnMut。 由 
编译 絮 生 成 的 闭 包 结 构 体 实例 在 调用 fn_mut 方 法 时 ， 需 要 &mut self. 

闭 包 c 同 样 可 以 调用 两 次 。 但 是 如 果 在 和 闭 包 c 同 样 的 作用 域 中 使 用 
s 的 不 可 变 售 用， 编译 右 束 会 报错 ， 因 为 s 已 经 和 被 于 包 c 投 可 蕉 倍 用 进行 
了 捕获 。 所 以 在 第 9 行 的 println! 语句 中 使 用 s 就 会 报错 。 但 是 在 第 11 
行 ，s 依 旧 可 以 作为 不 可 变 借 用 ， 因 为 之 前 s 的 可 变 倍 用 在 离开 第 10 行 作 
用 域 之 后 就 已 经 归还 了 所 有 权 。 

实现 了 FnMut 的 闭 包 ， 必 然 会 实现 FnOnce， 但 不 会 实现 Fn， 如 代码 
清单 6-39 所 示 。 

代码 清单 6-39: 实现 了 FnMut 的 闭 包 的 情况 


l. #![feature(fn traits) ] 

2 fn main () { 

3 let mut & = "rush"sto string |); 

4 | 

Bh let mk é= || & f~" rust") 

6 C(); 

7 // error: expected a closure that implements the `Fn` trait, 
8 // but this closure only implements `FnMut` 
9 A Gealt 

10. Seall once (()); 

ti // error: cannot borrow `òs`ò as immutable 

LZ; Fi because it is also borrowed as mutable 
13. (J přintin! (rr S} 

14. } 

i printila" relr Ar "resh rer reek" 

ili 


在 代码 清单 6-39 中 ， 第 9 行 显 式 地 调用 call 方 法 时 ， 编 译 器 会 报错 ， 
并 提示 该 闭 包 只 实现 了 FnMut。 而 第 10 行 则 可 以 显 式 地 调用 call_once 方 
VF 

未 捕获 任何 环境 变量 的 闭 包 会 日 动 实现 Fn 

没有 捕获 任何 日 由 变量 的 闭 包 ， 会 日 动 实 现 Fn， 如 代码 清单 6-40 所 


ZN o 
代码 清单 6-40: 没有 捕获 任何 环境 变量 的 财 包 目 动 实现 Fn 
1. fn main() 4 
2. let c = ||{ printin! ("hhh") }; 
Fa CU) F 
4. CH)? 
Ba 3 


is 6-40 E X WAEA tH RE A a ee, FF ARATE 
Fo mut pe Ae EY EE, PRIMA DA RS. KE DAERAH AS 
为 其 目 动 实现 的 结构 体 实 例 并 未 失去 所 有 权 ， 只 可 能 是 &self。 上 所 以 ， 
该 财 包 一 定 实现 了 Fn。 


规则 总 结 

综合 上 面 的 几 种 情况 ， 可 以 得 出 如 下 规则 。 

:如果 闭 包 中 设 有 捕获 任何 环境 变量 ， 则 默认 目 动 实现 Fn 。 

- 如 果 闭 包 中 捕获 了 复制 语义 类 型 的 环境 变量 ， 则 : 

> ”如果 不 需要 修改 环境 变量 ， 无 论 古 否 使 用 move 关 键 字 ， 均 会 日 
动 实现 Fn。 

> 如 果 需 要 修改 环境 变量 ， 则 目 动 实现 FnMmut。 

` 如 果 闭 包 中 捕获 了 移动 语义 类 型 的 环境 变量 ， 则 : 

> ”如 果 不 需 要 修改 环境 变量 ， 且 没有 使 用 move 关 键 字 ， 则 目 动 实 
MFnOnce。 

> ”如果 不 需要 修改 环境 变量 ， 有 日 使 用 了 move 关键 字 ， 则 自动 实现 
Fn. 

> 如 果 需 要 修改 环境 变量 ， 则 目 动 实现 FnMmut。 

使 用 move 关键 字 ， 如 果 捕 获 的 变量 是 复制 语义 类 型 的 ， 则 财 包 
会 目 动 实现 Copy/Clone， 人 个 则 不 会 目 动 实现 CopWClone。 

在 日 党 的 开发 中 ， 基 本 可 以 根据 上 面 的 规则 对 闭 包 会 实现 哪个 trait 
做 出 正确 的 判断 。 
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和 Ruby 之 类 ， 闭 包 的 使 用 冰 围 非 党 广泛 。 但 是 在 这 些 动态 语言 中 ， 闭 包 
捕获 的 环境 变量 基本 都 是 对 象 〈 此 处 指 面 同 对 象 编程 语言 中 的 对 象 ， 属 
于 引用 次 型 ) ， 使 用 不 当 容 多 造成 内 存 进 满 。 并 且 在 这 些 语言 中 ， 闭 包 
是 在 堆 中 分 配 的 ， 运 行 时 动态 分 友 ， 由 GC 来 回收 内 存 ， 调 用 和 回收 闭 
包 都 会 消耗 多 余 的 CPU 时 间 ， 更 不 用 说 使 用 内 联 技术 来 优化 这 些 财 包 
了 。 侧 Rust 使 用 trait 和 匿名 结构 体 提供 的 团 包机 制 是 非常 强大 的 。Rust 
的 闭 包 实现 受到 了 现代 C++ 的 局 发 ， 将 捕获 的 变量 放 到 结构 体 中 ， 这 样 
的 好 处 瓯 是 不 会 占用 堆 内 存 ， 拥 有 更 高 的 性 能 ， 可 以 使 用 内 联 技 术 来 消 
除 函 数 调 用 开销 并 实现 其 他 关键 的 优化 ， 比 如 对 编译 大 目 动 实现 的 闭 包 
结构 体 进 行 优 化 等 。 从 而 允许 在 任何 环境 《包括 裸 机 ) 中 使 用 财 包 。 


Rust HY AE K SUL till 58 45 BET A) IA BE PY, 3K 
样 可 能 有 一 些 不 便 ， 比 如 无 法 将 不 同 的 财 包 保存 到 一 个 数组 中 ， 但 是 可 
以 通过 把 财 包 当 作 trait 对 象 来 解决 这 个 问题 ， 如 代码 清单 6-41 所 示 。 
IRIDA 6-41: 把 财 包 作为 trait 对 象 


1. fn boxed closure(c: &mut Vec<Box<Fn () >>) i 


Es let s = "second"; 

CP epush (Bows :new(| | RD 
4. Se (boss new moves || printem: (“ii -I)a 
Ba SOUS (BOxs newl | BEC ("Chara J) 
S.. } 

Ts En meant) 4 

one let mut c: Vec<Box<Fn()>> = vec! []; 

3 boxed closure (&mut c); 

DO: fon E 18 & 

(es Eis ji irst / second. y third 

12s } 

Lae a 


Mis 6-41 8 847 EH -AEE fae RAY AVec<Box< 
Fn O) >>, RRNA BAY Fig ORR ABox<Fn O >% 
AY, Box<Fn () > Atra g, EAEE] Box <T> way We 
—S Aa trait R, RRA SFR RE. HOW ASA SS 
APD AE, trait AEWA ARN, FEISTY ARE Cvtable) 来 
确定 调用 哪个 闭 包 。 这 里 需要 注意 的 是 ， 第 4 行 代码 中 的 财 包 默认 以 不 
可 变 借 用 方式 捕获 了 环境 变量  s， 但 是 这 里 需要 将 闭 包 装 箱 ， 稍 后 在 
iter_call 国 数 中 调用 ， 所 以 这 里 必须 使 用 move 关 键 字 将 s 的 所 有 权 转 移 到 
闭 包 中 ， 因 为 变量 s 是 复制 语义 类 型 ， 所 以 该 财 包 捕获 的 是 原始 变量 s 的 
副本 。 

像 这 种 在 函数 boxed_closure 调 用 之 后 才 会 使 用 的 闭 包 ， 叫 作 逃 侈 闭 
包 (escape closure ) 。 因 为 该 财 包 捕 获 的 环境 变量 “逃离 > 了 
boxed_closure 函 数 的 栈 帧 ， 所 以 在 图 数 栈 帧 销毁 之 后 依然 可 用 。 与 之 相 
对 应 ， 如 采 是 跟随 轴 数 一 起 调用 的 财 包 ， 则 是 非 逃逸 财 包 (non-escape 


closure ) 。 


闭 包 作为 函数 参数 
闭 包 可 以 作为 函数 参数 ， 这 一 点 直接 提升 了 Rust 语 言 的 抽象 表达 能 
力 ， 令 其 有 了 完全 不 弱 于 Ruby、Python 这 类 动态 语言 的 抽象 表达 能 力 。 
下 和 面 比较 了 Rust 和 Ruby 两 种 语言 中 的 any 方 法 ， 访 方法 用 于 按 指 定 条 件 
确认 数组 中 的 元 又 征 侣 存在 。 
Rusti# =: 
veany(|&x| x == 3); 
Rubyi# =: 
v.eany?{|i]l 1 == 3} 
看 得 出 来 ，Rust 语 言 和 Ruby 语 言 中 对 闭 包 的 用 法 基本 相似 。 
因为 用 包 属 于 trait 语 法 糖 ， 所 以 当 它 被 当 作 参数 传递 时 ， 它 可 以 极 
用 作 泛 型 的 trait 限 定 ， 也 可 以 直接 作为 trait 对 象 来 使 用 。 代 但 清单 6-42 首 
和 完 以 trait 限 定 的 方式 实现 了 一 个 any 方 法 。 
代码 清单 6-42: 以 trait 限 定 的 方式 实现 any 方 法 
Le Le SEGi: Opes Sir 
trait Any { 
fn any<F>(&self, f: F) -> bool where 
Self: Sized, 
FEF: Fn(u32) => bool; 


} 
impl Any for Vec<u32> { 


YO OO FSP W ND 


B. fn any<F>(&self, f: F) -> bool where 


9. Self: Sized, 

J Fe Ent@s2) => pool 

ih { 

lz. for &% iff Salf f 

LS is 1E a Gey i 

14. return true; 
15 2 } 

L6. } 

Lly false 

ip, } 

1 | 

20. En Maan ) 

Bl let v= vec! [1,2,3]3 
ee let b = v.any(|x| x == 3); 
Eaa DEINCLAL({:7}"y Gs 
24. } 


在 代码 清单 6-42 中 ， 第 1 行 的 use 语 句 是 可 有 可 无 的 ， 因 为 Fn 并 不 受 
trait MI LAW APR. MUE 2 行 开始 定义 了 一 个 trait, KEMAN 
Any。 需 要 注意 的 是 ， 此 处 目 定 义 的 Any 不 同 于 标准 库 提 供 的 Any。 议 
trait 中 声明 了 泛 型 图 数 any， 访 图 数 泛 型 F 的 trait 限 定 为 Fn (u32) -> 
bool， 这 种 形式 更 像 水 数 指针 类 型 ， 有 别 于 一 般 的 沁 型 限定 二 F: Fn 到 
u32，bool>>。 其 实 函 数 指针 也 是 默认 实现 了 Fn、EFnMut、FnOnce 这 
三 个 triat 的 ， 比 如 代码 清 蛙 6-43 束 展示 了 函数 指针 作为 团 包 参 数 的 情 
Dlo 

代码 清单 6-43: 函数 指针 也 可 以 作为 闭 包 参 数 


FH @aliere(elesure? F) -> 232 
where Fr En (132) => 132 
{ 
closure (1) 
} 
fn. countertie 132) -> 132 { atl 1 
fn main() { 
let result = call (counter); 
aASSEEt qi (2, Fesult) ;F 


-d 
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代码 正常 编 详 运行 。 这 是 因为 此 函数 指针 counter 也 实现 了 Fn。 

回 到 代码 清单 6-42， 第 3 行 的 where 从 人 句 对 Self 做 了 Sized 限 定 ， 这 意 
味 着 ， 当 Any 被 作为 trait 对 象 使 用 时 ， 访 方法 不 能 被动 态 调 用 ， 这 属于 
— FHL TEA o 

代码 清单 6-42 的 第 7 行使 用 impl 天 键 字 为 Vec<u32 之 类 型 实现 了 any 
方法 。 该 方法 会 友 代 传 入 的 财 包 ， 依 次 调用 ， 如 果 满 足 财 包 表 达 式 中 指 
定 的 条 件 ， 则 返回 true， 人 否则 返回 false。 

在 main 国 数 中 ， 则 可 以 使 用 形 如 代码 清单 6-42 第 22 行 那样 的 形式 来 
调用 any 方 法 ， 以 答 找 动态 数组 v 中 是 售 存 在 满足 条 件 的 元 系 。 像 这 样 通 
过 将 财 包 作为 参数 ， 可 以 把 一 段 动态 的 逻辑 投 需 传 入 指定 方法 中 进行 计 
算 ， 这 极 大 地 提高 了 程序 的 灵活 性 和 抽象 能 力 。 最 重要 的 是 ， 在 Rust 中 
使 用 财 包 ， 完 全 不 需要 担心 性 能 问题 。 

除了 上 述 静 态 分 发 的 形式 ， 也 可 以 将 财 包 作为 trait 对 象 动态 分 发 ， 
如 代码 清单 6-44 所 示 。 代 码 清 单 6-44: 将 闭 包 作为 trait 对 象 进行 动态 分 
I 


O ons Dd OO e w NY P 


st 
ECJ a 


it trait Any { 

2 im anylsselt, Ty &(FaGusZz) -> bool)) => bool; 
3 } 

4. impl Any for Vec<u32> | 

ae fh any (tselrt, £5 &(Fa(usz) -> Poal] -> bool 1 
6 for kx in self, iter(}) { 

7 TE Tt (se) 4 

Da return true; 

9 . } 

} 

j 11 false 

LAs } 

Las | 

iA EM. maint} + 

13s let v = vec! [1,2,3]; 

1.6% let b = v.any(&|x| x == 3); 

i ee SLL IYA" Bi? 

LB we j 


代码 清早 6-44 将 闭 包 作为 了 trait 对 象 ， 这 样 代 人 码 更 加 简练。 动态 分 
用 比 静 态 分 发 的 性 能 低 一 些 ， 但 还 是 完全 可 以 和 C++ 媲美 的 。 动 态 分 发 
闭 包 在 实际 中 更 加 党 用 于 回调 函数 (callback) 。 

比如 Rust 的 Web 开 发 框架 Rocket 的 中 则 件 实现 ， 束 利用 了 闭 包 作为 
回调 函数 ， 其 实现 如 代码 清单 6-45 所 示 。 

代码 清单 6-45: Rocket 框 架 中 间 件 代码 示意 


Le pub Struct. AdHoe 1 
Zs name: &'static str, 
Be kind: AdHocKind, 
4. 3} 
5. pub enum AdHocKind { 
6. oven 
Ta # [doc (hidden) ] 
8. Request (Box<Fn(&mut Request, &Data) + Send + Sync + 'static>), 
9. 
10. } 
11. impl AdHoc | 
12. 
La. pub in on vequest<r>(hatie: &'static str, fi F) -> AQHOG 
14. where F: Fn(&mut Request, &Data) + Send + Sync + 'static 
15. { 
16. AdHoc { name, kind: AdHocKind: :Request (Box: :new(f)) } 
hy } 
18. } 
19. impl Fairing for AdHoc { 
20. mies 
ZL fn on request (&self, request: mut Request, data: &Data) i 
22. if let AdHocKind::Request (ref callback) = self.kind { 
2D callback (request, data) 
24. } 
FAF } 
2b. 
Zilu j 


NS 6-45 ean 了 Rocket 框 染 中 间 件 Fairing 实 现 的 简单 示意 ， 为 
了 突出 重点 ， 这 里 省 略 了 很 多 代码 。 

代码 第 1 行 定 义 了 AdHoc 结 构 体 ， 接 下 来 定义 AdHocKind 枚 举 体 ， 
其 中 包含 了 四 种 枚 举 值 (Attach、Launch、Request、Response) , ASAN 
例 中 只 显示 出 Request 一 种 ， 它 包含 的 值 类 型 是 一 个 trait 对 象 的 财 包 ， 
Box<Fn (&mut Request, &Data) +Send+Sync+’ static>. 

代码 第 13 行 为 AdHoc 结 构 体 实现 了 on_request 方 法 ， 其 参数 为 一 个 


ALF, ZAE M traith E Fn (&mut Request, &Data) 
+Send+Synct+’ static， 表 明 该 财 包 接收 两 个 参数 ， 第 一 个 是 可 变 引 用 ， 
第 二 个 是 不 可 变 引 用 ， 并 且 是 可 以 在 线程 中 安全 传递 的 ，” static 生命 
周期 用 来 约束 该 闭 包 必须 是 一 个 逃逸 团 包 ， 只 有 逃逸 团 包 才 能 装 箱 ， 代 
人 码 清单 6-46 的 示例 展示 了 这 一 点 。 

代码 清单 6-46: MA’ static R 


1 fn main() { 

2 let s = "hello"; 

Fa let c: Box<Fn() + "static> = Box::new( move||{ s:})¿ 
4 } 


如 果 对 代 人 码 清 蛙 6-46 第 3 行 的 团 包 去 挥 move 关 键 字 ， 则 变 为 Fn 闭 
包 ， 会 以 不 可 变 引 用 方式 来 捕获 变量 绑 定 s， 因 为 有 了 ”static 约束 ， 编 
译 右 会 报销。 现在 使 用 move 关键 字 ， 会 强制 执行 复制 语义 ， 则 编 详 
回 到 代码 清单 6-45 中 ， 从 第 21 行 代码 开始 ， 为 AdHoc 实现 了 
Fairing trait 中 定义 的 on_request 方 法 ， 访 方法 内 部 使 用 了 if let, WRI 
配 到 相关 的 团 包 ， 则 调用 该 团 包 。 这 是 动态 分 发 的 团 包 在 实际 中 作为 回 
Vad PA ALAN 
闭 包 作为 函数 返回 人 
因为 团 包 是 trait 语 法 糖 ， 所 以 无 法 直接 作为 函数 的 返回 值 ， 如 末 要 
把 闭 包 作为 返回 值 ， 必 须 使 用 trait 对 象 ， 如 代码 清单 6-47 所 示 。 
代码 清单 6-47: 将 财 包 作 为 函数 返回 人 
il fn saquare() -> Boxk<Fn(i13s2) -> 132> { 
2 Box: :new(|1]| 1*1 ) 
3 } 
= a fn main(){ 
= let square = square(); 
6 assert eq! (4, square (2Z)); 
fe assert eq! (9; square (3) ) 7 
3S. | 
代码 清单 6-47 返 回 一 个 财 包 来 计算 平方 。 返 回 的 财 包 为 trait 对 象 Box 
<Fn (i32) ->i32 之 ， 在 main 函 数 中 可 以 直接 调用 它 。 


代码 清单 6-47 中 的 闭 包 指定 为 Fn， 可 以 多 次 调用 ， 但 是 如 果 希 望 
只 调用 一 次 ， 那 么 是 不 是 就 可 以 下 接 指 定 FnOnce 呢 ?如 代码 清早 6-48 所 
不 。 

代码 清单 6-48: 指定 返回 闭 包 为 FnOnce 


L In square () -> BONXENONGE (132) -> 132> 4 
2 Box::new( |i| {i*i }) 

3 } 

4. æn main() { 

o. let square = square (); 

6 assert eqi (4, squate(2))s 

è: 


} 
代码 清单 6-48 编 译 会 报 如 下 错误 : 
error/E0161]: 


cannot move a value of type std::ops::FnOnce(132) -> 132: 


the size of std::ops::FnOnce(i32) -> 132 cannot be statically determined 


该 错误 的 含义 是 : 对 于 编译 期 无 法 确定 大 小 的 值 ， 不 能 移动 其 所 有 
权 。 在 代码 清单 6-48 中 ， 如 果 要 调用 财 包 Box<FnOnce (i32) ->i32 
>>， 就 必须 先 把 FnOnce (i32) -> 让 2 从 Box<T > 中 移出 来 。 而 此 时 Box 
二 本 二 中 的 T 无 法 在 编译 期 确定 大 小 ， 不 能 移动 所 有 权 ， 所 以 就 报 出 了 
上 述 错 误 。 

FnOnce 装 箱 为 Box<FnOnce> 之 后 ， 其 对 应 的 由 编译 器 生成 的 闭 
包 结 构 体 实例 就 是 Box 二 ClosureStruct 二 类 型 (假如 闭 包 结构 体 名 为 
ClosureStruct) ， 该 闭 包 结构 体 实现 FnOnce 的 call_once 方 法 的 接收 者 本 
来 是 self， 也 束 是 闭 包 结构 体 实例 ， 现 在 变 成 了 Box 二 self 和 >， 世 就是 装 
箱 的 闭 包 结构 体 实 例 。 现 在 想 从 Box<self> 里 移出 Self 这 个 闭 包 结构 体 
实例 来 进行 调用 ， 因 为 编译 期 无 法 确定 其 大 小 ， 所 以 无 法 获取 self。 而 
对 于 Fn 和 FnMut 来 说 ， 闭 箱 以 后 分 别 对 应 的 是 &Box<self 之 和 &mnut Box 
<self>， 所 以 不 会 报错 。 对 于 此 问题 ，Rust 给 出 了 一 个 解雇 方案 ， 如 
代码 清单 6-49 所 示 。 

代码 清单 6-49: 使 用 EnBox 代 蔡 FnOnce 


#! [feature (fnbox) ] 

use std::boxed::FnBox; 

fn sgquare() => Box<FnBox(1i32) => 132> { 
Box::new( |i] {i*i }) 

} 

fn main() { 
let square = square(); 


assert eq! (4, square(2)); 
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(CASS 16-4928 1747 (HN J #! [feature (fnbox) ] 特性 ， 同 时 也 需 
要 使 用 use 来 引入 定义 于 标准 库 的 boxed 模 块 中 的 FnBox trait。 只 需要 简 
旱地 把 FnOnce 蔡 换 为 FnBox， 即 可 解决 上 和 面 编译 错误 的 问题 。 这 是 因为 
FnBox 施 加 了 一 点 小 小 的 “ 麻 法 ”， 代 码 清单 6-50 展 示 了 FnBox 的 源 代 。 
代码 清单 6-50: FnBox 源 码 示意 


1. #[rustc paren sugar] 

Že pub trait FnBox<A> {| 

cm type Output; 

4. tn Gall Dox (selit Box<Selt>, args? A) -> Self: :Outpuc; 
Ss ] 

6. impl<A, F> FnBox<A> for F 

Ta where F: FnOnce<A> 

8. { 

Bs type Output = F::Output; 

10. fr Gall boz(self: Boxer> args: A) => Fi sOutpur i 
1 SLL Call gnos (args) 

La } 

bags J 


14. impl<'a, A, R> FnOnce<A> for Box<FnBox<A, Output = R> + "a> 1 
L5; type Output = R; 


LG. exten “rist-call”" TA Call pnes(self, arga: A) > BR 4 
ded selt, call pox (args) 
135 } 


由 于 篇 幅 限 制 ， 代 码 清 日 6-50 只 展示 了 部 分 FnBox 源码。 看 得 出 
来 ，FnBox 也 是 一 个 调用 语法 糖 ， 因 为 使 用 了 #[rustc_paren_sugar] 属 
性 ， 访 trait 实 现 了 call_box 方 法 ， 第 一 个 参数 和 之 前 的 Fn、FnMut、 
FnOnce 定 义 的 方法 有 很 大 不 同 ， 访 方法 的 第 一 个 参数 self 是 Box<Self> 
类 型 。 其 实 之 前 trait 中 的 self、&self、&mnut self 参 数 都 是 一 种 洽 略 形 
式 ， 其 完整 形式 如 下 所 示 。 

- Self 对 心 self: Self. 

-&self 对 应 self: &Self. 

‘Rmut self 对 心 self: S&cmut Self. 

HWE, self: SomeType<Self> 这 种 形式 应 该 适用 于 任意 类 型 
(SomeType) ， 但 实际 上 ， 这 里 只 文 持 Box<T>>。 上 所 以 ，self: Box< 
Self> 这 种 类型 指定 会 目 动 解 引用 并 移动 Self 的 所 有 权 ， 因 为 Box 委 工 > 
支持 DerefMove 〈 人 参见 第 5 章 ) 。 

Self: Box<self> 之 是 通过 调用 call box 来 间接 调用 call once 的 ， 
为 ”Box 过 FnBox> 实 现 了 FnOnce。 这 看 上 去 完全 是 一 个 “曲线 救国 ”的 方 
宁 ， 有 所以， 在 装 箱 时 使 用 FnBox 来 蔡 代 FnOnce 只 是 临时 的 解决 方 采 ， 在 
未 来 的 Rust 碑 本 中 ，FnBox 会 航 共 用 。 

出 现 这 种 问题 的 根本 原因 在 于 ，Rust 中 的 函数 返回 值 里 只 能 出 现 类 
型 。 虽 然 有 trait 对 象 可 用 ， 但 是 性 能 上 也 会 有 所 消耗 。 为 了 解雇 此 问 
题 ，Rust 团 队 提 出 了 一 个 新 的 方案 ， 叫 impl Trait 语法 ， 该 方案 可 以 让 
国 数 直接 返回 一 个 trait， 如 代码 清单 6-51 所 示 。 

代码 清单 6-51: impl Trait 示 例 


| 
2. a (ara j 

Be d 

4. fn main(){ 

2 let square = square(); 

Sis assert eq! (4, square(2Z)); 


Ta } 


代码 清单 6-51 中 用 到 的 impl Trait 语法 是 Rust 2018 版 本 中 引入 
的 。impl Trait 代表 的 是 实现 了 指定 trait 的 那些 类 型 ， 相 当 于 泛 型 ， 属 


于 静态 分 发 。 
代码 第 2 行 直 接 返 回 一 个 impl FnOnce (u8, u8) ->u8。 在 impl 关 键 
字 后 而 加 上 了 闭 包 trait， 这 样 就 可 以 直接 人 返回 一 个 FnOnce trait. 


6.2.5 fy KÆ fin Jal EH 


闭 包 可 以 作为 函数 的 参数 和 返回 值 ， 那 么 财 包 参数 中 如 果 人 名 有 引用 
的 话 ， 其 生命 周期 参数 该 如 何 标 注 ? 先 来 思考 代码 清单 6-52。 
代码 清单 6-52: 泛 型 trait 作 为 trait 对 象 时 的 生命 周期 参数 


ib use std::fmt::Debug; 

Z trait DoSomething<T> { 

3 fn de sth(a&selft, value: Tj? 

4 } 

Js ampl<'’a, T: Debug> DoSomething<T> for &’a usize { 
6 tn do sth(easelt, value: T) 4 

fi 

8 


Brien ("ieee r Valna; 


- N 


LO. fn foox"a>(b: Box<DoSomething<é"a usize>>) | 
Lles let s: usize = 10; 

LZ b.do sth(&s) 

Lie | 

LA. in. maint) 4 

13x let x = Box: :new(&2usize) ; 

LS; LOG (x) F 

i ine PP 


代码 清单 6-52 定 义 了 DoSomething<T >， 它 是 一 个 泛 型 trait， 其 中 
定义 了 方法 签名 do_sth， 然 后 为 &usize 类 型 实现 了 访 trait。 

代码 第 10 行 到 第 13 行 定义 了 一 个 函数 foo， 其 参数 b 以 trait 对 象 
Box<DoSomething<&usize 之 > 为 类 型 。 在 该 函数 内 ， 人 参数 b 调 用 
do_sth 方 法 ， 并 把 局 部 变量 绑 定 s 的 不可 变 借 用 作为 do_sth 方 法 的 参数 。 
整个 函数 foo 也 锌 标注 了 生命 周期 参数 。 

在 main 印 数 中 声明 了 一 个 Box<&usize 之 变量 绑 定 xX， 并 调用 


foo (x) 。 整 段 代 人 码 在 编译 时 会 报 如 下 错误 : 


error[E0597]: ss does not live long enough 
12 | b.do sth (ES) 

| ^ does not live long enough 
ia | 3 


| - borrowed value only lives until here 
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构 ， 从 而 &s 束 会 变 成 念 王 指针， 这 是 Rust 绝 不 可 能 允许 出 现 的 情况 ， 如 
图 6-3 所 示 。 


et 3= foo(x) ; 


} 

l foo 旨 数 中 的 S 必 须 比 
fn foo<'a>(D Box<DoSomething<&"a usize>>) { foo(X) 的 存在 时 间 长 ， 
但 是 现在 5 先 被 析 构 了， 
违反 了 借用 规则 . 


b.do sth(&s) 
A 





图 6-3: 代码 清单 6-52 生 命 周 期 参数 问题 示意 图 
代码 清单 6-52 第 10 行 的 foo 国 数 签名 中 的 生命 周期 参数 有 什么 问题 
呢 ? 现 在 这 样 的 生命 周期 参数 的 意义 是 ， 把 foo 函 数目 身 的 生命 周期 和 
其 内 部 的 局 部 变量 绑 定 s 的 生命 周期 天 联 了 起 来 ， 这 就 要 求 ，foo 函 数 内 
b.do_ sth (&s) 方法 调用 参数 s 的 生命 周期 必须 长 于 main 函 数 中 foo (x) 
六 数 调 用 的 生命 周期 。 es an 时 变量 绑 定 ， 代 码 第 
16 行 相当 于 let_3=foo (x) 。 这 违反 了 第 5 和 草 学 过 的 信用 规则 ， 有 产生 其 
垂 指针 的 风险 。 


IX, fook žr Fre A Wy traitXt 4 Box< DoSomething < &usize> > 4, 
含 的 &usize 引 用 是 从 外 部 引入 的 ， 如 代码 清单 6-52 第 15 行 所 示 ， 古 在 
main 也 数 中 直接 定义 好 ， 然 后 才 传 给 foo 函 数 的 。 有 所以， 该 引用 的 生命 
ly ase i maa 目前 代码 清单 6-52 的 生命 周期 参数 标记 则 
完全 无 法 正确 表达 二 意思 ， 那 么 对 于 这 种 情况 该 如 何 定义 生命 周期 
BB We? 


Rust Ale sett SPOTS, IE YT E ar al EH (Higher- 
Ranked Lifetime ) ， 也 叫 高 阶 trait 限 定 (Higher-Ranked Trait Bound 
，HRTB ) 。 该 方案 提供 了 一 个 for< 二 > 语法 ， 具 体 使 用 方式 如 代码 清 
单 6-53 所 示 。 

代码 清单 6-53: 使 用 for< 之 语法 


1 use std::fmt::Debug; 

Z trait DoSomething<T> { 

3's iti Go Ssti(eselt, value: T); 

4 . } 

5 impl<'a, T: Debug> DoSomething<T> for &'a usize { 
6 Pm de sthieselt, valves T) 4 

7 rn 

Bi, } 

9. } 

LO, fn. bar(b: Bom<for<*t> DoSomething<&*'f usize>>) { 
Lr; let s: usize = 10; 

Las b.do SENESI? 

lhe } 

Is, Em mart} 4 

lia let x = Box::new(&2uS1Ze) ; 

16% bar (x)? 

y y ER 


代码 请 单 6-53 第 10 行 定义 了 bar 函 数 ， 其 函数 签名 中 的 生命 周期 参数 
使 用 了 高 阶 生 命 周期 参数 for<′ f>DoSomething<&’ f usize> ， 这 
样 殴 修复 了 生命 周期 的 问题 ， 正 第 编译 运行 。 

for< > ”语法 整体 表示 此 生命 周期 参数 只 针对 其 后 面 所 跟 看 的 “对 
象 ”， 在 本 例 中 是 DoSomething<&' f usize> ， 生 命 周 期 参数 ′ { 是 在 
for<’ f > 中 声明 的 。 使 用 for<' f > 语法 ， 就 代表 bar 函 数 的 生命 周 
期 和 DoSomething<&' fusize> 没有 直接 关系 ， 所 以 编译 正 第 。 

实际 开发 中 会 经 党 用 闭 包 ， 而 财 包 实现 的 三 个 trait 本 里 也 是 沁 型 
trait， 所 以 肯定 也 存在 闭 包 参数 和 人 返回 值 都 是 引用 类 型 的 情况 ， 如 代码 
清单 6-54 所 示 。 


isis 26-54: 财 包 参数 和 返回 值 部 是 引用 类 型 的 情况 


la SETGE Pack<a> {f 


Bo datas (usZ, us2Z), 
co Sunes Fi 
4. } 
S. JMGLF? Pick<F> 
6. where Fs Fn(&(u32, u32)) => &u32 
Ta { 
Ss fn call(&self) -> &u32 { 
a (self.func) (&self.data) 
aL) G } 
tie J 
l2 In Maz (data: e(ü32+ sz) )} -> Buse í 
i e Lf data. 0 > data. 41 
14. &data.0 
LS x jelse{ 
ls &data.1 
17. } 
LB x: f 
19. fn main() { 
20. let elm = Pick { data: (3, 1), func: max }; 
on DEINEN! (=f) ", Elm. call; 
eee |} 


在 代码 清单 6-54 中 ， 泛 型 结构 体 Pick 模 拟 了 闭 包 的 行为 ， 字 段 data 
使 用 元 组 类 型 存储 模拟 闭 包 的 参数 ， 字 段 func 用 来 存储 一 个 可 执行 的 团 
全 

代码 第 5 行 到 第 11 行 为 结构 体 Pick 实 现 了 一 个 call 方 法 ， 泛 型 F 使 用 
Fn (& (u32, u32) ) ->&u32 作 为 trait 限 定 。 整 段 代 人 码 编译 正 铝 运行 。 

值得 注意 的 是 ， 此 处 的 trait 限 定 中 使 用 了 引用 类 型 ， 但 是 并 没有 显 
式 地 标记 生命 周期 参数 ， 为 什么 可 以 正常 编译 呢 ? 这 是 因为 编译 器 自动 
为 其 补 齐 了 生命 周期 参数 。 

代码 第 9 行 会 调用 存储 于 结构 体 Pick 中 的 闭 包 ， 并 且 会 把 call 方 法 中 
的 &self 作 为 参数 进行 传递 。 这 个 调用 与 代 但 清单 6-52 和 6-53 中 所 示 的 情 
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生命 周期 和 self.func 方 法 的 生命 周期 相关 联 ， 因 为 财 包 的 捕获 引用 是 从 
外 部 环境 获取 的 ， 和 call] 方 法 没有 关系 。 合 则 编译 肯定 无 法 通过 ， 比 如 
像 下 面 这 种 写法 束 会 产生 编 详 错误 : 
fn call<'a>(&'a self) -> &'a u32 { 
(self.func) (&self.data) 
} 

所 以 这 里 正确 地 使 用 生命 周期 参数 的 方式 束 是 用 局 阶 生 命 周 期 ， 如 
代码 清单 6-55 所 示 。 

代码 清单 6-55: 编 详 苍 按 亏 阶 生命 周期 来 目 动 补 齐 财 包 参 数 中 的 
生命 周期 参数 
struct Piek<E> 4 
2 dabar isa, Moa, 
3 rine Fi 
4 } 
5. impl<F> Pick<F> 
6; where Pe forc f> Tale f (BZ, Tj) -> g Ë 032, // EARR 
7 { 
8 fn call(&self) -> &u32 { 
9 (self.func) (&self.data) 


Lle 3 
12. in, Max(data: (üa 0632)) -> Wig í 
LS ie Gale. > Gata. | 
14. &data.0 
l5; else{ 
LGe &data.1 
LF, } 
lge J 
19. fn main() { 
zi; let elm = Pick { datat (3; 1), Tuner max +; 
Za. SELL (ÒF, SIm. Cali [Je 


ALn J 


代码 清单 6-55 第 6 行使 用 了 高 阶 生命 周期 ， 代 码 正 常 编译 运行 。 但 
需要 注意 的 是 ， 高 阶 生 命 周期 的 这 种 for 二 > 语法 只 能 用 于 标注 生命 周 
期 参数 ， 而 不 能 用 于 其 他 泛 型 类 型 ，。 


6.3 is 
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系 的 同时 ， 按 团 包 内 指定 的 逻辑 进行 操作 。 比 如 代码 清单 6-42 中 实现 的 
any Nik, WAH Sfr RERS, KARERE HAJER 
件 的 元 系 。 

用 循环 语句 迭代 数据 时 ， 必 须 使 用 一 个 变量 来 记录 数据 集合 中 每 一 
次 旭 代 所 在 的 位 置 ， 而 在 许多 编程 语言 中 ， 已 经 开 始 通 过 模式 化 的 方式 
来 返回 迭代 过 程 中 集合 的 每 一 个 元 素 。 这 种 模式 化 的 方式 承 叫 迁 代 天 
(Iterator ) Pex, (HAGA ae Ay DAK e CBE ERIE TAM tt 
模式 也 被 称 为 游标 (Cursor ) 模式 ， 它 提供 了 一 种 方法 ， 可 以 顺序 态 
HDRES Aas PATO MOLA i EB RY A an WY A AR E A SL AH 
To 


6.3.1 WADIA TAS AA BIR TR as 
TEAR BEAD APE, ShB (External Iterator ) FW BIKAR BES 


(Internal Iterator ) . 

Ab PIER StH AY ERAS (Active Iterator) ， 它 独立 于 容器 之 
外 ， 通 过 容器 提供 的 方法 (比如 ，next 方 法 就 是 所 谓 的 游标 〉 来 迭代 下 
一 个 元 素 ， 并 需要 考虑 容 需 内 可 迭代 的 剩余 数量 来 进行 妈 代 。 外 部 运 代 
癸 的 一 个 重要 特点 是 ， 外 部 可 以 控制 整个 过 历 进 程 。 比 如 Python、 
Java RICHH SB PRIANR AS, BLAESP ARIA o 

内 部 迭代 需 则 通过 迭代 需 目 身 来 控制 迭代 下 一 个 元 素 ， 外 部 无 法 干 
了 预 。 这 意味 着， 只 要 调用 了 内 部 从 代 右 ， 并 通过 闭 包 传 入 了 相关 操作 ， 
丈 必 须 等 竺 友人 代 需 依 次 为 其 中 的 每 个 元 系 执 行 守 相关 操作 以 后 才 可 以 俘 
正 遍 历 。 比 如 Ruby 语 言 中 的 each 迭 代 器 就 是 典型 的 内 部 迭代 器 。 

早期 的 〈1.0 碑 本 之 前 ) Ruste tte Amba as, MA aba Asc 


法 通过 外 部 控制 迭代 进程 ， 再 加 上 Rust 的 所 有 权 系 统 ， 导 致使 用 起 来 很 
LAR 0 
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代码 清单 6-56: FE EY A BIE Tae 


Le Ereait Initerator<T: Copy> 4 
2x En each<Fs Encl) -> T>lamut selit, fe: F)? 
Sis } 
4.  impl<T: Copy> InIterator<T> for Vec<T> { 
Din fn each<F: Fn(T) => T>(&mut self, f: Fh í 
Ga let mut i = QO; 
Ta while 1< self.len() { 
8. self[{i] = f(self[i]); 
9. i += 1; 
La a } 
il } 
lla J 
15. A fas) 4 
14. let mut v = veo! (1,2, 3]% 
Ik P veachi 2 =% 3j 
16. assert egilar Gs Ble Bleed] iF 
Lie f 


Ss 6-568) 7—0 AE MINA Reseach, AHK, A 
HMI Tas 与 容器 的 绑 定 较 紧 密 ， 并 且 无 法 从 外 部 来 控制 其 轴 历 进程 。 更 
He, MTR SRL, PRR. Rus Sy Me KAW EEA 
间 的 论证 ， 决 定 改 为 外 部 迭代 器 ， 也 就 是 for 循 环 ， 如 代码 清单 6-57 所 
不 。 

代码 清单 6-57: for 循 环 示例 

lL. £n maint) 1 

let vw = vec![1l, 2; 3; 45 SS) 3 
for i1inv 4 


iL i ATL I)3 


G Ee S aa 


} 


代码 清单 64 57 是 一 个 简单 的 for 循 环 示 例 。for 循 环 是 一 个 典型 的 外 部 
迭代 器 ， 通 过 它 可 以 遍历 动态 数组 v 中 的 元 素 ， 并 且 此 遍历 过 程 完全 可 
以 在 动态 数组 v 之 外 进行 控制 。Rust 中 的 for 循 环 其 实 是 一 个 语法 糖 。 代 


但 清单 6-58 展 示 了 for 循 环 展 开 后 的 等 价 代 人 码 。 
代码 清单 6-58: for 循 环 展开 后 的 等 价 代码 


le ER Meant) 1 

la let v = vec! [l; 2, 3, 4, 3l 

3. { // 等 价 于 for 循环 的 scope 

4. let mut iterator = vV.anto iter (); 
2 loop { 

6. mateh tterator.next() i 
Ea Some (i) => { 

B. HrInCLO! (74 p 232 
9 . } 

J None => break, 

ue } 

1.2 } 

1 } 

14. } 


代码 清单 6-58 从 第 3 行 开 始 ， 创 造 了 一 个 内 部 作用 域 ， 等 价 于 for 循 
环 的 作用 域 。 代 码 第 4 行 通 过 调用 v 的 into_iter 方 法 声明 了 一 个 可 变 迭 代 
ax_iterator. Æ 54T loop F, iitmatchVLACIIA Kas next yy 
法 ， 授 历 Vv 中 的 元 系 ， 直 人 到 next 方 法 返回 None， 退 出 循环 ， 授 历 结 束 。 


6.3.2 Iterator trait 
简单 来 说 ，for 循 环 就 是 利用 过 代 器 模式 实现 的 一 个 语法 糖 ， 它 属于 
外 部 于 代 帮 。 磊 代 絮 也 是 Rust 一 八 性 的 典型 表现 之 一 。 不 出 所 料 ，Rust 
中 依然 使 用 了 trait 来 抽象 欠 代 右 模 式 。 人 代码 清单 6-59 展 示 了 Rust 中 迭代 
器 Iterator trait 的 源码 。 
代码 清单 6-59: Iterator trait 源 人 码 示 意 
1. trait Iterator { 


Fae type Item; 
cs fn next (&mut self) -> Option<Self::Item>; 
Ais } 


代码 清单 6-59 展 示 了 Iterator traitz Rust P X ARASIRA IR 


> HPne Ee SE PIAA AY ASEAN TK. EKRE, i2 

ended 了 很 多 其 他 方法 ， 基 本 部 包含 了 默认 实现 。 该 trait 中 还 包 合 
了 一 个 关联 类 型 Iem， 并 且 next 方 法 会 返回 Option<Self: : Item 放 类 
型 。Item 和 Self 可 以 看 作 占 位 类 型 ， 它 们 表示 实现 该 trait 的 具体 类 型 的 相 
Ailes 

MKH trait, AY DAE EIAs, Sia 6-60 
ZIN o 

代码 清单 6-60:， 通过 实现 Iterator trait?) Æ Ae X IKRA 


人 

count: VWeLzs, 

Fa } 

4. impl Iterator for Counter { 

3M type Item = usize; 

Ga fn next(&mut self) -> Option<usize> { 
{a self.count += 1; 

sA IC Selt. gunt < 6 4 

nM Some (self.count) 

tU, } else { 

Ls None 

1 } 

| A } 

Le we } 

Loe To naint] x 

Loy let mut counter = Counter { count: U J? 
Be oo asSSere eq! (Seme(.), Counter NESE) }F 
Ega assert eq (Some) r counber.next())7 
19. assert: eq! (some (3), countber.next());? 
20 ORCI Sa! (s0me(4), Sonnter.next () Ji 
AL assert cq (Seme(s), Counter.next () JF 
LA s assert eq! (None, counter.next () ); 
250 J 


代码 清单 6-60 中 定 义 卫 一个: 十 构 体 Counter， 为 其 实现 Iterator 之 后 ， 
它 就 成 为 了 一 个 从 代 右 。 通 过 调用 next 方 法 来 达 代 其 内 部 元 素 。 


值得 注意 的 是 ， 在 为 Counter 实 现 next 方 法 时 ， 指 定 了 关联 类 型 Ttem 
为 usize 类 型 ， 因 为 Counter 中 字段 count 是 usize 类 型 ，next 方 法 要 返回 的 
fe Option<usize > 287 . 

E817, next AWIKA TL PAAR A AD 6, 1K 
是 为 了 演示 。 对 于 一 个 真正 的 迭代 占 ， 除 了 雷 要 使 用 next 方 法 获取 下 一 
ICR, M BAAN KER, ROTHMAN as EA HB H 

在 Iterator trait 中 还 提供 了 一 个 方法 叫 size_ hint ， 代 人 码 清 时 6-61 展 示 
了 其 默认 实现 。 
代码 清单 6-61: Iterator trait 提 供 的 Size_ hint 方 法 源码 示意 

PUD EfaLtte ITiSerator |{ 
type item} 


m 512e hint (ssel > (usize, Option<usizes) 4 
(0, None) 


o ad A A e WN H 


E. 
ARIE 6-61 展示 了 size hint 方法 的 默认 实现 ， 其 返回 类 型 是 一 
个 元 组 Cusize, Option<usize>) ， 此 元 组 表示 迭代 器 剩余 长 度 的 边界 
信息 。 元 组 中 第 一 个 元 素 表 示 下 限 Gower bound) ， 和 第 二 个 元 素 表 示 上 
IE (upper bound) 。 和 第 二 个 元 率 是 Option<usize 之 类 型 ， 代 表 已 知 上 限 
或 者 上 限 超过 usize 的 最 大 取 值 范围 ， 比 如 无 筋 欠 代 。 此 方法 的 默认 返回 
E (0, None) E&H FAFE -o 

ARABIA 6-62 EAN S KAE FERIRA AS size _hint 77d - 

代码 清单 6-62: SIRA EAk A H size_hint 

Le EB Maing 1 
let a 名 [1327 Si= [dye 2, 317 
let mut iter = a.iter(); 
assert Col SOMEL3)), LESSEE. SIZE NINEN) 
Lier. Nees () 2 


assert egiii; Some{Z)), iter. size RintAj ji 


“JH Oo ES W MM 


AS es 6-62 F AY BZA iter 7 YEAS HRM A PIE as» BEV VELA 
next 方 法 ， 友 代 需 的 剩余 长 度 束 会 减少 ， 直 到 减 为 0 为 止 。 方 法 size_hint 
返回 的 元 组 上 限 和 下 限 是 一 致 的 。 第 3 行 方法 调用 a.iter O 使 用 了 数组 a 
的 不 可 变 借 用 ， 其 类 型 为 &' a [i32; 3]。 对 于 & a [T]M&’ a mut [T] 
XW, size hint WYSE Py [I EIA as ke ABET IAS ASSET EBS 
值 ， 如 图 6-4 所 示 。 


size_hint 
(8, Some(8) ) 





图 6-4: Xf&’ al[T]A&’ a mut [T] 类 型 中 的 size_hint 方 法 求 值 示意 图 

第 3 行 方法 调用 a.iter O IRIE Nae Pe, Rea 
了 起 始 指针 ptr 和 终点 指针 end， 它 们 之 间 的 距离 束 是 size_hint 方 法 返回 的 
值 。 

7yivésize_hinth) AN wea as, AES Ruste S RA 
WAEA VERRAN Tai. TEESE A a8) LAID 
A, SEIT A HAS A EIA aOR FESR A Ba Fe, GEN 77 2 
size_hint Ik LHH Yo WER SCALE UE NIA RAISE, BY A fii] 
精准 地 扩展 容 需 容量 ， 从 而 避免 不 必要 的 容量 检查 ， 提 高 性 能 。 代 码 清 
竺 6-63 展 示 了 如 何 使 用 迭代 右 来 人 姐 加 字符 串 。 

代码 清单 6-63: 18 FIA (Rae EI FB 


1. fn main() | 

iy let mut message = "Hello", po strang(); 

cP message.extend(&[' ','R', ‘'u', 's', 't']); 
4. assert eq! ("Hello Rust", é&message) ; 

Bic } 


代码 清单 6-63 中 声明 了 String 类 型 的 字符 串 message， 通 过 调用 


extend 方 法 为 其 退 加 字符 。 事 实 上 ，extend 方 法 是 被 定义 于 Extend trait 
的 。 代 码 清 单 6-64 展 示 了 Extend 和 String 中 实现 extend 方 法 的 源码 。 

代码 清单 6-64: Extend 和 String 类 型 实现 extend 方 法 的 源码 示意 
pub trait Extend<A> { 
fn extend<T>(&mut self, iter: T) 
where 
T: IntoIterator<Item = A>; 


impl Extend<char> for String { 
fn extend<I: IntoIterator<Item = char>>(&mut self, iter: I) { 


Let Iterator = Litor. inte ater [) ; 


LU; let (lower bound, ) = iterator.size hint]; 
Lis self.reserve (lower bound) ; 

LA LOL Ci 1 Alera lor 1 

L3. self.push (ch) 

14. } 

13s } 

i 


Extend trait 是 一 个 泛 型 trait， 其 中 定义 了 extend 方 法 ， 这 是 一 个 泛 型 
方法 ， 其 泛 型 参数 T 使 用 了 trait 限 定 Intolterator<Item=A>， 这 表示 该 泛 
型 方法 只 接受 实现 了 Intolterator 的 类 型 。 而 String 类 型 正好 针对 char 类 型 
实现 了 该 汉 型 trait。 

在 代码 第 9 行 String 类 型 实现 的 extend 方 法 中 ， 首 先 使 用 into_iter 方 法 
SRAM S-Ni Kas, PAPI IA Nas size hintWyASRA ARIE, ARI 
第 10 {FAN ETE PIR. PARAS, EIRA BBR SE xe 
的 ， 所 以 这 里 取 哪 个 都 可 以 。 

代码 第 11 行 调用 了 字符 串 的 reserve 方 法 ， 访 方法 可 以 确保 扩展 的 字 
节 长 度 大 于 或 等 于 给 定 的 值 。 这 样 做 是 为 了 避免 频 党 分配 。 代 但 清单 6- 
63 中 给 定 的 友 代 需 长 度 应 该 是 s， 那 么 为 字符 串 分 配 的 额外 空间 至 少 应 
该 是 20 个 字 节 《因为 每 个 字符 占 4 字 和 节 ) . thay Ree 1004. reserve 
方法 只 是 提供 了 一 种 保证 ， 它 并 不 做 出 分 配 空间 的 行为 。 


RR 1247 fori Ain ASI es, Jae String 28 YY 
push 方 法 逐个 添加 给 字符 串 。 

现在 可 以 看 得 出 来 size_hint 方 法 的 重要 性 了 。 为 了 确保 该 方法 可 以 
获得 迭代 器 长 上 度 的 准确 信息 ，Rust 又 引入 了 两 个 trait， 分 别 
是 ExactSizeIterator 和 TrustedLen ， 它 们 均 是 Iterator 的 子 trait， 均 被 定 
义 于 std: : iter 模 块 中 。 

ExactSizelterator 提 供 了 两 个 额外 的 方法 len 和 is_empty， 要 实现 len 必 
须 先 实现 Iterator， 这 了 束 要 求 size_hint 方 法 必须 提供 准确 的 迭代 器 长 度 信 
=| 


TrustedLen 是 实验 性 trait， 还 未 正式 公开 ,但 是 在 Rust 源 人 码 内 部 ， 它 
束 像 一 个 标签 trait， 只 要 实现 了 TrustedLen MIERA, FÈ size_hint 获取 
Wks BSH (EW, AS traithe een [RANA Se, 
从 而 提升 了 性 能。 

ExactSizeIterator 和 TrustedLen 的 区 列 在 于 ， 后 者 应 用 于 没有 实现 
ExactSizeIterator 的 大 多 数 情况 。 开 发 者 可 以 根据 具体 的 情况 目 定 义 实 现 
ExactSizeIterator， 但 是 对 于 茶 些 友 代 器 ， 开 发 者 并 不 能 为 其 实现 
ExactSizeIterator， 上 所 以 需要 TrustedLen 做 进一步 的 限定 。 


6.3.3 IntoIterator trait 和 迭代 器 


上 上 一 节 介 绍 了 Iterator trait, RAI SAB, RMA NAEMER A at 
中 的 元 素 ， 必 须 将 其 转换 为 和 迭代 噩 才 可 以 使 用 。 并 且 在 for 循环 语法 糖 
中 ， 也 使 用 了 into_iter ZARA ATER IRE Pia as ADAIR BS PIER 
是 什么 ? BASRA, “256 \Intolterator trait 开 始 。 

第 3 章 讲 过 类 型 转换 用 到 的 From 和 JInto 两 个 trait， 它 们 定义 了 两 个 方 
法 ， 分 别 是 from 和 into， 这 两 个 方法 互 为 反 操 作 。 对 于 友 代 峰 来 说 ， 并 
没有 用 到 这 两 个 trait， 但 是 这 里 值得 注意 的 是 ，Rust 中 对 于 trait 的 命名 
也 是 具有 高 度 一 致 性 的 。 

Rust 也 提供 了 FromIterator 和 JIntoIterator 两 个 trait， 它 们 也 互 为 反 
操作 。Fromlterator 可 以 从 严 代 器 转换 为 指定 类 型 ， 而 Intolterator 可 以 从 
指定 类 型 转换 为 迭代 器 。 关 于 FromIterator 的 细节 在 6.3.5 节 会 着 重 介 绍 ， 
这 里 先 介 绍 IntoIterator。 


AC 6-65 fe zN J Intolterator 的 源 公 。 
代码 清单 6-65: IntoIterator 源 公示 意 


1 DUS Erain Inbelberatar | 

2 type Item; 

Bà type IntoIter: Iterator<Item=Self::Item>; 
4 fh ante ESE (salf) -> Self: IntOItEr; 

z } 


从 代码 清单 6-65 中 可 以 看 出 ， 方 法 into_iter 古 在 该 trait 中 定义 的 。 
into_iter 的 参数 是 self， 代 表 该 方法 会 转移 方法 接收 者 的 所 有 权 。 同 时 ， 
WAVES 1 [Al Self: : Itolter 类 型 Self: : Intolter 是 关联 类 型 ， 并 且 

Hae 了 trait 限 定 Iterator<Item=Self:，， : Item>, ARE DEKI S 
Iterator f RAY A RENE AIA Tae o 

EY in HINER A ee ize VecxT> RE, ESCH SIntolterator, FV 
iH Winto_iter YAIR AIA Nas. ST 6-66) aN J Vec<T> RWS 
El Intolterator PRAY - 

代码 清单 6-66: Vec 二 本 二 实现 IntolIterator 源 公示 意 


dl impl<T> IntoIterator for Vec<T> { 
2 type Item = T; 
3 type IntoIter = IntolIter<T>; 
4 Eñ into ater (mut self) <> Intolter<f> 1 
Dic unsafe { 
6 ows 
7 IntoIter { 
8. buf: Shared::new unchecked (begin), 
> Cap, 
10 . ptr: begin, 
ie M end, 
Le. j 
ule } 
14. } 
lse ] 


代码 清单 6-66 为 了 演示 方便 只 展示 了 部 分 源码 。 看 得 出 来 ， 最 终 
返回 的 古 一 个 定义 于 std: : vec 醒 其 中 的 Pntolter 结 构 体 。 该 结构 体 包 合 


下 列 四 个 成 员 字 段 。 

- Buf ， 通 过 Vec< 工 > 类 型 的 动态 数组 起 始 地 址 begin 生 成 一 个 内 部 
使 用 的 Shared 指 针 ， 指 同 该 动态 数组 中 实际 存储 的 数据 。 

Cap ， 获 得 访 动 态 数 组 的 容量 大 小 ， 也 殉 是 内 存 占用 大 小 。 

-Ptr ， 指 定 了 begin 的 但， 代表 进 代 需 的 起 始 指针 。 

-End ， 代 表 磊 代 右 的 终点 指针 ， 根 据 Vec 二 TT 二 动态 数组 的 长 大 len 
和 起 始 地 址 begin 计 算 offset 获 得 。 

Intolter 结 构 体 也 实现 了 Iterator trait， 拥 有 了 next、size_ hint 和 count 
= SATE, CEP RIAN IAN o 

简单 而 言 ， 就 是 Vec<T> 实 现 了 IntoIterator， 因 此 可 以 通过 into iter 
方法 将 一 个 Vec<T> 关 型 的 动态 数组 转换 为 一 个 Intolter 结 构 体 。 
Intolter 结 构 体 拥有 访 动 态 数组 的 全 部 信息 ， 并 且 获 得 了 该 动态 数组 的 所 
有 权 。 同 时 ，Intolter 结 构 体 实现 了 Iterator trait， 人 允许 其 通过 next、 
size_hint 和 count 方 法 对 其 进行 进 代 处 理 。 所 以 ，Intolter 束 是 Vec<T 二 转 
换 而 成 的 迭代 器 。 整 个 过 程 如 图 6-5 所 示 。 





图 6-5: Vec<T> Nea eA 


转换 “Itolter tease ae Aas AM, ERRAR 
中 ， 有 很 多 情况 是 不 能 转移 所 有 权 的 。 因 此 ，Rnust 还 提供 了 为 外 两 个 碗 
代 器 专门 处 理 这 种 情况 ， 分 别 是 Iter 和 IterMut 。 这 三 种 迭代 器 类 型 和 
所 有 权 有 如 下 对 应 关系 。 


‘Intolter ， 转 移 所 有 权 ， 对 应 self。 

Iter ， 获 得 不 可 变 信 用 ， 对 应 &self。 

.IterMut ， 获 得 可 变 借用 ， 对 应 &mnut self. 

Iter 和 IterMnut 达 代 需 的 典型 应 用 融 是 slice 类 型 ， 代 码 清单 6-67 展 示 了 
slice 类 型 数组 的 循环 示例 。 

代码 清单 6-67: slice 类 型 数组 循环 示例 


1. fn main() { 


2 bet arr = [dy r dy 4, Ble 
Sy ror 1 Tm arraiterij 4 
4 DELCI! I "p Ls 
sP } 
6. printint i" se, gm) 7 
Ta } 


代码 清单 6-67 中 声明 了 slice 类 型 的 数组 ， 该 类 型 的 数组 使 用 for 循 环 
时 ， 并 不 能 目 动 转换 为 迭代 器 ， 因 为 并 没有 为 [ 丰 类 型 实现 TntoIterator， 
而 只 是 为 & a [TI 和 & ”a mut [了 类 型 实现 了 IntoIterator， 相 应 的 
into_iter 方 法 内 部 实际 也 分 别 调用 了 iter 和 iter_mnut 方 法 。 也 融 是 说 ， 在 
for 循 坏 中 使 用 &arr 可 以 目 动 转换 为 迭代 右 ， 而 无 须 显 式 地 调用 iter 方 
法 。 用 iter 或 iter_mnut 方 法 可 以 将 slice 类 型 的 数组 转换 为 Iter 或 IterMut 夫 代 
AT o 

is 6-68 RAN SIA as lter HI IR o 

代码 清单 6-68: Iter 迭 代 器 的 源码 示意 

ls BUS SEFUGE TEE’ RS. Fe ‘ae | 

pens “eons: F, 
end: *const T, 
_marker: marker: :PhantomData<é&'a T> 


Om B&B W N 


- | 

A DASH OK, weReslterf RS ptrtlendistt, LAAT AER 
Hét*const T, WP irae tees, marker be Hem ETA i 
记 ， 是 为 了 让 生命 周期 参数 ' a 有 用 武之 地 ， 通 过 编译 。 关 于 
PhantomData 的 更 多 内 容 会 在 第 13 章 中 详细 介绍 。 


Iter JAP ASTRA A A IAs, IA ABE CLAS ROR A ABA 
AG. ARABIA  6-69/R aN SAARI as lterMuthy yA 
代码 清单 6-69: IterMut 氨 代 器 源码 示意 
Le PUB SEFUCE TESINUCS a, Te “ar { 


bx pers “nue Ti 

ce end: *mut T, 

4. _marker: marker::PhantomData<é&'a mut I>; 
Ds } 


A aelterMut'? a ptrMendta Ly An Aka eT, AIRE I 
Was FY AAR A ae AE TUS H6-70 FAN S uE H iter mutT iA 
at “SA AeA a, FAS EE efor Hae SME slice H AA 
HEN BETS URE 

Wiis 6-70: (EH AY Ae (has 


fn main() { 
let mut. arr = [1, 2, Be 4, Bl 
FOr 1 IN arreter man) 
*1 += 1; 


} 
printi i ra rr Jf [|] 


= OF) CF ss Ww BD EF 


s o 

Rust Wyte RAS ELSE AN MA Intolter. IterflIterMut=—FH. LKQ, 
String 类 型 和 HashMap 类 型 均 有 Drain 迭代 器 ， 可 以 迭代 删除 指定 范围 内 
的 值 ， 为 字符 串 和 HashMap 的 处 理 提 供 方 便 。 不 官 Rust 中 的 迄 代 器 有 多 
少 和 种， 重要 的 是 ， 这 些 从 代 占有 的 实现 都 这 人 循 上 述 规 人 律 ， 这 也 是 Rust 局 度 
一 任性 的 设计 所 市 来 的 好 处 。 反 过 来 ， 不 省 是 Slice 类 型 的 数组 ， 还 是 
Vec<T > 类 型 的 动态 数组 ， 尔 或 是 HashMap 等 容 需 ， 友 代 需 模 式 都 将 其 
统一 抽象 地 看 待 成 一 种 数据 流 容 右 ， 通 过 对 欠 代 需 提 供 的 “游标 ?进行 增 
Naa AY WA ake iit FA BE —-N ICR 


6.3.4 A Kas ih Ac as 


JET Fh DE AS a ER ETH BRA SS IN BT i» CHILE EC BLS TE 
Fr, BEACRE PF EY BOR TK ABE PE HC ee JA te BEST PK EK wt AT 


以 按 需 用 水 。 但 是 不 同 的 场景 有 不 同 的 需求 ， 厨 房 用 水 需要 对 水 进行 加 
热 ; 而 洗 识 间 则 不 只 需要 加 热 ， 还 需要 让 冷 热 水 混合 ， 甚 至 还 需要 将 水 
演 分 解 为 更 细小 的 水 流 ， 这 样 洗 涡 才 够 祝 服 。 要 满 中 这 些 不 同 的 需求 ， 
所 要 做 的 不 是 让 目 来 水 广 投 需 铺设 专门 的 管道 ， 而 只 需要 在 目 来 水 接口 
上 安 冯 不 同 的 设备 。 厨 房 只 需要 安 朔 厨 宝 ， 将 流 经 的 水 加 热 后 再 输出 : 
洗 深 间 需 要 安 疼 热水器 ， 另 外 铺设 冷 热 管道 和 人 花 酒 即 可 满足 需求 。 这 些 
不 同 的 设备 虽然 功能 不 同 ， 但 是 它们 都 齐 循 目 来 水 管道 的 标准 规范 ， 这 
样 才 能 适 配 各 种 各 样 的 场景 。 

在 软件 世界 中 ， 通 过 适配器 模式 ”同样 可 以 将 一 个 接口 转换 成 所 需 
的 另 一 个 接口 。 适 配 磊 模式 能 够 使 得 接口 不 兼容 的 类 型 在 一 起 工作 。 适 
配器 也 有 一 个 别名 ， 叫 包装 器 〈Wrapper ) 。Rust 在 迭代 器 基础 上 增 
加 了 运 配 右 模式 ， 这 束 极 大 地 增强 了 迭代 堪 的 表现 力 。 

Mapt fc a5 

Map ze Rust E fs LA a Rae URIA 6-71 Aa. 

代码 清单 6-71:， map 方 法 示例 


1 fn main() { 

2 L6G @a=— [1; 2; 31% 

3 let mut iter = a.into iter().map(|x| 2 * xX); 
4. assert eq! (ater.next(), Some (2) ); 

3 assert eq! (iter.next(), Some (4) ); 

6 aSSGEt egi (2ter.Hext(), Some 6) ) > 

7 assert SH: (LLEF. Mert {j}; Nene) > 


a } 

ARIDE 6-710934 etinto_iter A EAH E ANER JAR 
Val FIA as map h IAEE AMAR itero PAIS KU Hiter] 
next H YAAR A BES cae, «TI, OBES ORR TA EY 
逻辑 ， 最 后 输出 相应 结果 。 

map Ji GEN SIAN as wae SIA aes. PSSA 6-72 
展示 了 定义 于 std: : iter: : Iterator 中 的 map 方 法 源码 。 

代 人 得 清单 6-72: ie asmap h AVES AN R 


1 pub trait Iterator { 

2 type Item; 

3 Kgs 

4 fn map<B, F>(self, f: F) -> Map<Self, F> 
Ss where 

6. Self: Sized, 

7 F: FnMut(Self::Item) -> B, 
8 { 

9. Map { iter: self, f: f } 
10. } 

He 3} 


mapzelterator trait 中 实现 的 方法 ， 第 一 个 参数 Self 代表 实 现 Iterator 的 
具体 类 型 ， 第 二 个 参数 f 是 一 个 FnMut 闭 包 。 该 团 包 trait 限 定 为 
FnMut (Self: : Item) ->B, FL ySelf: : Item 是 指 为 实现 Iterator 具 
体 类 型 设置 的 关联 类 型 Iem。 最 终 ， 访 方法 返回 了 一 个 结构 体 Map 去 
Seljf，EF> 之 ， 值 得 注意 的 是 ， 这 里 Self 被 限定 为 Sized， 否 则 Self 在 编译 期 
无 法 确定 大 小 束 会 报销 。 这 个 结构 体 Map 束 是 一 个 友人 代 堪 适 配 需 。 

代码 清单 6-73 展 示 了 定义 Map 的 源码 。 

代码 清单 6-73: 迭 代 堪 适配器 Map 源 人 码 示意 


l. #[Must use=-"iterator adaptors are lazy se. nm] 

2. #[derive(Clone) ] 

Se pub struct: Mapal; E> 4 

4. Ts I, 

a. E: F, 

om } 

Ts imMmpl<B, La Iterator; E> Iterator for Mapili; E> 
Ba where F: FnMut(I::Item) -> B 

9. { 

kD type Item = B; 

Tis fn next(&mut self) -> Option<B> { 

Les self.iter.next().map(&mut self.f) 

LS, } 

14. fn size hint (&self) -> (usaze, Option<usize>) 1 
L$; selt.iter,.61z6 hint () 

16% } 

x 

LD =: J 


Alihi, Mapze Piz arm, ERAAN, ~A 
是 iter ， 一 个 f , 2 AIAN IRAN AG. RAR HS 
Iterator trait, Map iX I —MIBE as. SIRT EAS Ia) A 
JEF, Bm oy YknextHsize_hint#l z Val H H N BS a aA Ras 
的 相应 方法 。 值 得 注意 的 是 ， 第 12 行 调用 的 map 方 法 是 next 方 法 返回 的 
Option<T 之 中 实现 的 另 一 个 map 方法 ， 后 面 的 革 市 中 会 介绍 该 方法 。 
通过 第 12 行 代码 中 的 map 方法 传 入 Map 中 存储 的 团 包 ， 束 可 以 对 每 个 
元 素 执 行 相应 的 逻辑 ， 最 终 再 返回 一 个 Option 二 TT 二 类 型 。 

你 可 能 已 经 注意 到 了 ， 代 码 清 蛙 6-73 PAR aes Map WRAY 
ELAtHEA J + [must_use= " ...... "1 属性 ， 诅 属性 是 用 来 及 出 警告 ， 提 
示 开 发 者 迭代 需 适 配 需 是 情 性 的 ， 也 束 是 说 ， 如 果 没 有 对 迭 代 需 产生 任 
何 “ 消 费 ” 行 为 ， 它 是 不 会 发 生 真 正 的 迭代 的 。 这 了 束 好 比 水 龙头 上 闭 好 了 
化 泗 ， 但 是 不 打开 水 龙头 ， 残 无 法 中 正 使 用 人 花 酒 。 而 调用 next 方 法 项 属 
于 “ 消 红 ”行为 。Rust 中 所 有 的 迭代 如 适 配 右 都 使 用 了 must_use 来 发 出 警 
FE. 


Fj o 


了 解 Map 适 配器 之 后 ， 再 回 到 代码 清单 6-71 来 查看 其 整个 执行 流程 
示意 ， 如 图 6-6 所 示 。 


a: [i32: 3] 


bod 


| into_iter() 
map( |x} 2° x) | : Intolter 
———— FP: xi 2°x 


ACE 





图 6-6: 代码 清单 6-71 中 map 方 法 工作 示意 图 

图 6-6 是 代码 清单 6-71 的 执行 过 程 的 简单 示意 图 。 数 组 a 通 过 into_iter 
方法 创建 了 友 代 器 Intolter 并 转移 所 有 权 ， 然 后 IntoIter 再 调用 Iterator trait 
中 实现 的 map 方 法 ， 传 入 闭 包 ，Intolter 迭 代 器 创建 了 一 个 迭代 器 适配器 
Map。Map 中 存储 了 迹 代 器 IntoIter 和 传 入 的 闭 包 F， 人 然后 通过 next 方 法 授 
A BCR, WRT ED I A o 

FL ft ch BC as 

be S Map, Rustin jE Pinter SRSA abcess, AVE LT 
std: : iterPatRH. PMSA ase Bc e HIIR o 

- Map , HW aa as FA BES oa dl A fe A RE 
BIA AAR 0 

Chain ， 通 过 连接 两 个 从 代 医 来 创建 一 个 新 的 从 代 莫 。 

` Cloned ， 通 过 找 见 原始 达 代 占 中 全 部 元 又 玉 创建 新 的 迭代 兹 。 

Cycle , @i—-S 7K RIAA as, SARs, Fk 
HRANA. 

Enumerate , @)#—-P@ ERITAMA ERR EAH 

G, val) ， 其 中 i 是 usie, MARAZ, val EARR [Al 
的 值 。 

Filter ， 创 建 一 个 基于 谓词 判断 式 (predicate， 产 生 布 尔 值 的 表达 


TK) WUE TORR MJANE o 

- FlatMap ， 创 建 一 个 类 似 Map 的 结构 的 迭代 器 ， 但 是 其 中 不 会 舍 
AFIRE. 

-FilterMap ， 相 当 于 Filter 和 Map 两 个 迭代 器 依次 使 用 后 的 效果 。 

- Fuse ， 创 建 一 个 可 以 快速 结束 过 历 的 迭代 硕 。 在 遇 历 迭代 右 时 ， 
Rik lala — None, MA ZIG AA ie 25 RAB ANone. Ia as 
i Aas A DAHA FR 

Rev, fi!) —PS FY VA Be E IA Ta o 

A 6-74 BEAN SR eo A a ee BC a EF ES 

代码 清单 6-74:， oP AR ae BC a 1 A BI 

1.fn main() { 


cm bee ger, = [1, 2, 3, 4, S3 

Sa Lee cL = gerl..cer() map |=) 2 ~= «) collect: Vecsiz); 
4. assert eg! (4ellesty l2; & Of Bz LOI); 

Die Let etre = (Fae T Mey SE) 

Gu let d2 = arri .iteť(j.ELlter map( |x| &.parse() .ek() ) 

Ta Lvs Sve Lot 3 

8. appert. Gq! (&c2Zlesly [lira 

9. lEt arri = [tale “Bt, ‘Ole 

人 for (idx, val) in arr3.iter().enumerate() { 

if Aes printin! ("idz: [:3}, val: {[}"; idx, val.te uppercase ()); 
oe } 

er ad 


代码 清单 6-74 第 2 行 到 第 4 行使 用 了 了 map 方法， 相应 地 ， 它 会 创建 
Map 运 配 硕 。 最 终 通 过 collect 方 法 迭代 生成 第 3 行 断 言 中 所 显示 的 Vec 反 
i32 之 动态 数组 。 

代码 第 5 行 到 第 8 行使 用 了 filter map 方法， 它 会 创建 FilterMap 适 配 
和 研 。 同 样 通 过 collect 方 法 生成 第 7 行 断 言 中 所 示 的 Vec<i32 之 动态 数组 。 

代码 第 9 行 到 第 12 行 使 用 了 enumerate 方 法 ， 它 会 创建 Enumerate 适 配 
右 ， 这 里 使 用 了 for 循 环 ， 因 为 此 友 代 天 的 next 方 法 返回 的 是 元 组 ， 所 以 
第 10 行 for 循 环 内 使 用 Cidx, val) 形式 。 


HAMEET BK (ash ase Rev， 它 使 用 rev 方法 ， 可 以 
文 持 反 回 遇 历 ， 如 代码 清单 6-75 所 示 。 
代码 清单 6-75: ret 方 法 示例 


fn main() { 
let a = ee y 3]; 
let mut iter = a.iter().rev(); 


ASSEre egs (LE NEC Uy Some tes) 天 区 


) 
assert Eğ! (ater.next(), Some(é2)); 
) 
) 


, some (&1l)); 


( ( 
assert eq! (ater.mext | 
( (), None); 


assert eq! (1 téer.nexst 


On an on & WN EF 


- 5 


ns 6-75 1 Fg rev vA Gl et SAA, Val A next Wisk 
Mize Bla. AEMET “Ree? 代码 清单 6-76 展 示 了 rev 方法 


的 源码 。 


代码 清单 6-76: retli 源 公示 意 


Mh 


8. 


J O A e w NY 


pub trait Iterator { 
type Item; 
fn rev(self) -> Rev<Self> 
where Self: Sized + DoubleEndedIterator, 


Rev { iter: self } 


} 


看 得 出 来 ，rev 方法 返回 了 Rev 结构 体 ， 它 束 是 实现 反 转 表 历 的 达 
代 器 适配器 。 注 意 这 里 Self 的 trait 限 定 中 包含 了 一 个 DoubleEndIterator 
trait， 意 味 着 只 有 实现 该 trait 的 类 型 才 可 以 使 用 此 方法 。 

代码 清 单 6-77 展 示 了 了 Rev 迭代 器 适配器 的 源码 。 

代码 清单 6-77: Reti 达 代 器 适配器 源码 示意 


pub struct Rev<T> { 
iter: Tj 

} 

impl<I> Iterator for Rev<I> 
where I: DoubleEndedIterator, 

{ 

bype Leen = <i as Iterator>=i i Lte 

fn next(&mut self) -> Option<<I as Iterator>::Item> { 
Self .iter next Dacre () 


eS co Oa OY oO ee te RY OE 


Reviz Au ZA MIRE AR AS ain Beiter, AKRAM aR. TEA 
其 实现 Iterator 时 ， 指 定 了 DoubleEnditerator 恨 定 。 并 且 将 关联 类 型 Item 
通过 无 蚊 义 完全 限定 语法 指定 了 Iterator 中 的 关联 次 型 。 
值得 注意 的 是 ， 在 next 方法 中 ， 调 用 了 Rec Pea 
next_back 方法 。 这 个 next_back 方 法 实际 上 是 在 DoubleEndIterator 中 定义 
的 ， 代 码 清 日 6-78 展 示 了 其 源码 。 
代码 清单 6-78: DoubleEndIterator 源 码 示 意 
1. pub trait DoubleEndedIterator: Iterator { 
me fn next. back(&mut self) -> Option<Selt: :Item>; 
ay } 
Ls, TAS 6-78 只 展示 了 DoubleEndlterator 的 部 分 源 
伺 。 看 得 出 来 ，DoubleEndIterator 是 Iterator 的 子 trait， 这 样 定 义 实 际 是 为 
了 扩展 Iterator。next_back 和 next 方 法 签名 非常 相似 ， 反 转 裔 历 正 是 基于 
此 方法 来 实现 的 。 代 码 清 单 6-79 展 示 了 next_back 的 使 用 示例 。 
代码 清单 6-79:，，next_back 方 法 使 用 示例 


L- fn taint) | 

Ea ket numbers = yec! [dy 2, dy Gy, Jp 6l? 
3% let mut iter = numbers: inte irer); 

4. assert eq! (some (lj), Leer. Tt 

Dies ASSErt eq! (Some (6), afernext back) ) ; 
O's assert eq! (Some(s), ater.next back()): 
Ts assert eq! (Some (2), Lreremext ()) 

8. aSSert. 60! (Somes (5) y LUSr.next() Js 

3 assert eq! EDs (4), Le) 7 

Ll) s assert. eq! (None, iter.next ()); 

tl assert. eq! (None, iter.next back () jz 


i PR 


ARI 6-79 28447 H Y next HYE, JKIEIZeSome (1) ， 属 于 正 
TE JJ] o 

代码 第 5 行 和 第 6 行 调 用 了 next back 方法 ， 返 回 的 分 别 是 Some (6) 
和 Some (5) ， 说 明 这 两 次 遇 历 是 反 回 过 历 ， 但 是 第 7 行 到 第 9 行 依次 又 
调用 了 next 方 法 ， 返 回 值 分 别 是 Some (2) 、Some (3) 和 Some (4) 。 
这 说 明 ， 在 执行 next_back 方 法 之 后 ， 迭 代 需 的 “ 洲 标 ”还 是 会 返回 到 上 
一 次 next 执 行 的 位 置 继续 执行 next， 这 也 是 该 方法 命名 为 next_back 的 
原因 。 在 第 10 行 和 第 11 行 中 ， 达 代 已 经 完毕 ， 均 返回 None。 

至 此 ， 我 们 就 知道 了 Rev 碗 代 右 适 配 硕 的 工作 机 制 ， 在 next 夫 代 
中 ， 调 用 next_back 方 法 。 只 有 实现 了 DoubleEndIterator 的 迭代 器 才 有 
next_back Wik, Emt, KRAKI Y DoubleEndIteratorHyik (048 fe 
调用 Iterator: : rev YET AW) o 

Rust 标 准 库 中 还 提供 更 多 的 友 代 需 适 配 右 ， 这 些 欠 代 吉 适配器 可 以 
目 由 灵活 地 组 合 ， 以 便 应 对 不 同 的 需求 。 图 6-7 展 示 了 友 代 震 适 配 硕 的 


LARW, 


Iterator 


I: Iterator 
F: Fn/FnMut/FnOnce 


Iterator Adapter 
Map/Rev/Chain/Filter/... 





图 6-7: jAR ASE AAS Al OA 
6.3.5 消费 器 


Rust PAE AAD TEN, that, ENA HAREN 
为 ， 除 非 调 用 next 方 法 去 消费 其 中 的 数据 。 EER BIA as AE A 
Awe eA forte, AVA see, fori Aha cH va AAS YY 
next 方 法 ， 从 而 达到 循环 的 目的 。 

为 了 编程 的 便利 性 和 更 高 的 性 能 ，Rust 也 捉 供 了 for 循 环 之 外 的 用 于 
H Ia Nas ABM ITIE, ENTINEN Seas (Consumer) 。 下 面 列 出 了 
Rust 标 准 库 std: : iter: : Iterator P SKEL AY ay AYA Bess o 

: any ， 其 功能 类 似 代 码 清单 6-42 中 实现 的 any 方 法 的 功能 ， 可 以 得 
Pe A as Fe A ETE i ER EER 

- fold ， 来 源 于 函数 式 编程 语言 。 该 方法 接收 两 个 参数 ， 第 一 个 为 
已 始 值 ， 第 二 个 为 融 有 两 个 参数 的 财 包 。 其 中 闭 包 的 第 一 个 参数 被 称 为 
祖 加 需 ， 它 会 将 财 包 每 次 欠 代 执行 的 结果 进行 累计 ， 并 最 终 作为 fold 方 
法 的 返回 值 。 在 其 他 语言 中 ， 也 被 用 作 reduce 或 inject。 

- collect ， 专 门 用 来 将 迭代 右 转 换 为 指定 的 集合 类 型 。 比 如 代码 清 
单 6-74 中 使 用 collect : <Vec<i32>> () 这 样 的 turbofish 语 法 为 其 


fae SAY, eA IE AS IS BER AVec <i32> XAH. LAL, 
它 也 被 称 为 “收集 器 ”。 

any 和 fold 

代码 清单 6-80 展 示 了 消费 器 any 和 fold 的 使 用 示例 。 

代码 清单 6-80: any 和 fold 的 使 用 示例 


1 fn main() { 

pa jet a = lds 2, 3le 

cP SASSGrt egi tarl EEr U Amy ISX] = '= Jr Erue)s 
| Let Sun = LLL rola(y,;, aC; X| aca + x) } 
Ə assert eq! (súm, 6); 

6 } 


在 代码 清单 6-80 的 第 3 行 中 ，any 方 法 检查 数组 a 中 是 售 存 在 不 等 于 2 
的 元 素 ， 返 回 true。 代 码 第 4 行使 用 fold 方 法 来 对 数组 a 进 行 求 和 ， 图 6-8 
展示 了 fold 的 求 值 过 程 。 


acc =0 
first iteration 


acc =~04+1=1 


second iteration acc -14+2=3 


third iteration 
| 3 | oO ACC E I HIG 


let a = [1, 2, 3]; 
let sum = a.iter().fold(0, lacc, &xl acc + x); 





图 6-8: fold 求 值 过 程 示 意图 
代码 清单 6-80 中 值得 注意 的 地 方 在 于 ，any 和 fold 传 入 的 财 包 的 参数 
是 一 个 引用 。 这 是 为 什么 呢 ? 代码 清单 6-81 展 示 了 any 和 fold 的 源 伍 。 
代码 清单 6-81: any 和 fold 的 源码 示意 


al Pub trait Tterator | 

2 type Item; 

3 TP 

4. In Any ES (Smat Selr,; mut. fs F] -F Bool 
5 where Self: Sized, 

6 Es FPnMut (celts: Licem) -> bool, 
7 { 

S [or a In salir 4 

9. LE £5 4 

La return true; 

os } 

La } 

L3. false 

14. } 

13s asa 

16% tA THLGSBy Be tselt, ith Bs mut 1: F) -> B 
4 ag gA where Self: Sized, 

Loe Es FadMutib, Selfis: Ltoem) => B, 
Lo { 

AP let mut accum = init; 

Pia for * Aan Self f 

22 + accum = f(accum, x); 

23s } 

24, accum 

28 o } 

ADe | 


看 得 出 来 ，any 和 fold 的 内 部 都 包 侣 了 一 个 for 循 环 ， 它 们 实际 上 是 
通过 for 循 环 来 实现 内 部 迭代 器 的 。 内 部 迭代 器 的 特点 是 ， 一 次 遍历 到 
J, ANSc#Freturn 、break 或 continue 操作 ， 因 此 可 以 避免 一 些 相 应 的 
检查 ， 更 有 利于 底层 LLVM 的 优化 。 

在 代码 清单 6-80 的 第 3 行 中 ， 使 用 的 是 数组 的 iter 方 法 ， 创 建 的 迭代 
耸 征 Iter 关 型 ， 访 类 型 的 next 方 法 返回 的 是 Option<&[T]> 或 Option 去 
&mut [T]> 类 型 的 值 。 而 for 循 环 实际 上 是 一 个 语法 糖 ， 会 自动 调用 友 代 


asl) next 方法 ，for AA P AY Pee E Il eee TUE AC, MAnextik E] 
(J Option< &[T] > Option<&mut [T] >A! FIRS [T] Smut [TZ 
型 的 值 的 。 
因此 ， 在 代码 清单 6-81 的 第 8 行 中 ，any 方 法 的 内 部 for 循 环 中 的 循环 
变量 x 是 一 个 引用 。 所 以 ， 在 代码 清单 6-80 中 ， 第 3 行 传 给 any 的 闭 包 参 
数 只 能 是 引用 形式 ， 否 则 就 会 报错 。 代 码 清 单 6-82 展 示 了 更 多 细 市 。 
代码 清单 6-82: any 方 法 示意 


Lx» Mat) | 

2 let arr = [be 2. ol? 

3 let resultl = arr.iter().any(|&x|] x != 2); 

4, let result2 = arr.iter().any(|x| *x != 2); 

5 // error: 

6 // the trait bound ‘&{integer}: std::cmp::PartialEq<{integer}>° is 

not satisfied 

re // let result2 = arr.iter().any(|x| x != 2); 

8. assert eg! (resultl, true) ; 
S a ASSE Eg! Test ErGE)} 
ige 


在 代码 清单 6-82 中 ， 第 3 行 和 第 4 行 的 any 方 法 闭 包 参数 分 别 使 用 了 
&x 和 和 x， 都 可 以 正常 运行 。 对 于 &x 参 数 的 闭 包 来 说 ， 在 any 方 法 内 部 调 
用 时 ， 会 因为 财 包 参数 的 模式 匹配 获取 x 的 值 ， 故 而 可 以 正常 运行 。 对 
于 X 参 数 的 财 包 来 说 ， 因 为 财 包 执行 体 使 用 了 解 引 用 操作 符 ， 因 此 也 可 
以 正常 运行 。 但 是 像 第 7 行 那样 的 用 法 就 会 抛 出 注释 所 示 的 错误 。 这 是 
因为 此 时 x 为 引用 ， 不 能 进行 比较 操作 。 

对 于 fold 方 法 来 说 ， 也 是 同样 的 道理 ， 如 代码 清单 6-83 所 示 。 

代码 清单 6-83: 使 用 fold 对 数组 求 和 示例 


Lo TE MLN í 

2 let arr = vee![1l, 2, 3]% 

3 let suml = arr,iter() —fold(Q, lacc; *| ace + x)? 
4 let SUnmz = arr.iter() «fold(0, lace; X| ace + *x); 
Bs Let SUMS = akr.iter().fold(0, |jace, &x| ace + m&); 
6 let sum4 = arr.inte ater().fole(0, |ace, x] acc + x); 
7 assert eq! (sumly 6); 

8 assert eq! (sum2z; 6); 

2 assert egi (sume, 6); 

LU., assert eq! (sum4, 6); 

Lly 过 


ais 46-834, 26347. BRAT AAS TI iter D AKA AL 
Hark AN A AIK (has lter2e AY, ATER eK. 6 FT 1H Hinto_iter 
方法 来 创建 的 迭代 器 是 IntoIter 类 型 ， 会 获取 arr 的 所 有 权 。 

因为 Iter 交 型 的 和 代 套 在 for 循 环 中 产生 的 循环 变量 为 引用 ， 所 以 在 
fold 内 部 的 for 循 环 中 传 入 财 包 的 循环 容量 也 是 引用 。 故 而 代码 清单 6-83 
的 第 3 行 、 第 4 行 和 第 5 行 都 可 以 正 彰 运行。 加 法 操作 对 引用 是 适用 的 。 

M Intolter AY IA as next 77 IAR [Al HY Option <T> AA, FF 
for 循 环 中 产生 的 循环 变量 是 值 ， 不 是 引用 。 所 以 在 代码 清单 6-83 第 6 行 
使 用 fold 时 ， 其 内 部 的 for 循 环 的 循环 变量 也 是 值 ， 所 以 这 里 闭 包 参数 也 
只 能 是 值 。 如 果 把 第 6 行 团 包 参 数 中 的 x 改 为 &X， 或 者 把 闭 包 体 内 的 x 改 
为 x*x， 均 会 报错 。 

Rust 除 了 提供 any 和 fold 两 个 消费 桌 〈( 内 部 从 代 器 ) ， 还 提供 了 其 他 
NAMA, be aall, for_eachfllpositionS$, FJ LAfEstd: : iter: : 
Iterator 的 文档 中 找到 它们 的 用 法 和 源码 。 在 众多 消费 器 中 ， 最 特殊 的 应 
该 算 collect 消 费 右 了 。 

collect} 3% #5 

通过 前 面 的 几 个 示例 我 们 已 经 知道 ，collect 消 费 需 有 “收集 ”功能 ， 
在 语义 上 可 以 理解 为 将 迭代 上 右 中 的 元 双 收 集 到 指定 的 集合 容 占 中 ， 比 如 
前 面 示例 中 所 看 到 的 collect，: <Vec<i32>> O , WeGIAR At 
系 收 集 到 Vec<i32 之 类 型 的 动态 数组 容 如 中 。 通 过 turbofish 语 法 还 可 以 
指定 其 他 的 集合 容器 ， 比 如 collect: : <HashMap<i32, i32>> () 


等 。 代 码 清 单 6-84 展 示 了 collect 消 费 器 源码 。 
代码 清单 6-84:， collect 源 人 码 示 意 
L, pub Erare Tierator 4 


Po type Item; 
4. fn collect<B: FromIterator<Self::Item>>(self) -> B where Self: 
Sized { 
Di Fromlterator::from iter(self) 
6. } 
te J 
看 得 出 来 collect 消 费 咒 的 源码 很 简单 ， 其 内 部 只 是 调用 
Fromlterator: : from iter 方 法 。 前 面 已 经 讲 过 ，FromIterator 和 
Intolterator 是 互 为 逆 操 作 的 两 个 trait。 人 代码 清单 6-85 展示 了 FromIterator 
RAS o 


Reis 426-85: FromIterator 源 码 示 意 
1. pub trait FromIterator<A>: Sized { 
ie in from itersI; tntelterator< temas iter; T) -> SGL; 
ce } 

该 trait 只 定义 了 唯一 的 泛 型 方法 from_iter， 它 的 方法 签名 中 使 用 了 
trait IR Œ Intolterator<Item=A>, KZK R SLU Y Intolterator ft!) 7H A A 
以 作为 其 参数 。 集 合 容 器 只 需要 实现 该 trait， 就 可 以 拥有 使 用 collect 消 
给 占 收 集 达 代 器 元 系 的 能 力 ， 代 码 清 单 6-86 所 展示 的 集合 MyVec 束 实现 
J FromIberotor trait. 

代码 清单 6-86: 目 定 义 集合 MyVec 实 现 FromIterator 


1. use std::iter::FromIterator; 

2 # [derive (Debug) ] 

3 struct MyVec (Vec<1i32>) ; 

4 impl MyVec { 

Ja fn new() -> MyVec { 

6 MyVec (Vec: :new() ) 

7 } 

8 fn add(&mut self, elem: 132) { 

Di self.0.push (elem) ; 

10, } 

Lly d 

12. impl FromIterator<i32> for MyVec { 

L3., En Erom Iter<Is Tntolterater<l tem = 132>>(1bers I) -> Sele 1 

14. let mut c = MyVec::new(); 

| x for 1 in iter { 

16. g adoi 

a } 

LS € 

L9 } 

Ae d 

21. fn main() { 

Ad s let drer = [V:s 3] aime iterij; 

Ada let o = MyvYeci s from Itertiter)? 

24. assert eq!(c.0, vec![0, 1, 2, 3, 4]); 

25. LEE LEBE = [0,.8) -be ter) 5 

26 let c: MyVec = iter.collect(); 

cag assert eg! (c.0,; vee: [lL ly Zr Sy 4l)? 

AD à Let LURE = (Mian alte ITET)? 
29. let c = iter.collect::<MyVec>(); 
30. assert eq (CU; veci [0; dy 2, 3, HFF 
Sle J 


ERIA 6-86, i 7028 2 PS 2 Vee <i32 > 8E  MyVec 
结构 体 ， 将 其 作为 目 定 义 的 集合 容器 ， 并 为 其 实现 FromIterator。 然 后 在 
main es 2 HP at BY LE H collect IRI (ak 7u CR Bl AE My Vec%# 


ae I o 


这 里 需要 注音 的 是 ， 和 直接 调用 MyVec: : from_iter 方 法 和 使 用 
collect 方 法 的 效果 是 一 样 的 。 


6.3.6 Fe MIE Ar Ae ae 
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fe PORES AE I ae as, ERY peA 
指定 的 步 数 来 表 历 ， 而 不 是 过 个 过 历 。 首 先 ， 需 要 定义 一 个 迭代 器 适 配 
arStep<I>, WRI 6-87 A 

代码 清单 6-87: E SAT asi Bc as Step <I> 
1. #[derive(Clone, Debug) ] 


2. #[must use = "iterator adaptors are lazy and do nothing unless 
consumed" | 

3. pub struct Step<I> { 

4, iter: I, 

op skip: usize, 

6. } 


RAS 6-877 X Siz AYR AStep<I>, WusEAIR Rae Ad 
a, Hip miter-A FERIER. skip HPF RAINE. HERR, FG 
要 为 其 实现 Iterator， 如 代码 清单 6-88 所 示 。 

代码 清单 6-88: 为 Step 实 现 Iterator 


impl<I> Iterator for Step<I> 

where I: Iterator, 

{ 

type Item = I::litem; 

fn next(&mut self) -> Option<I::Item> { 
let elt = self.iter.next(); 
if self.skip > O { 

self.iter.nth(self.skip - 1); 


O Ona oD U SP W HN F 


uE a DA elt 


代码 清单 6-88 为 Step 实 现 了 Iterator 中 定义 的 两 个 核心 方法 next。 值 
得 注意 有 的 是 ， 这 里 需要 将 关联 类 型 Ttem 指 定 为 原 达 代 桥 的 关联 类 型 I: 
Item. 

实现 next 和 size_hint 方 法 时 ， 必 须 符 合 Iterator trait 中 next 方 法 签名 规 
定 的 参数 和 返回 值 类 型 。 其 中 next 方 法 必须 按 指 定 的 步 数 来 迭代 ， 所 以 
此 处 next 方 法 实现 的 时 候 ， 需 要 根据 Step 适 配 需 中 的 Skip 字段 来 跳 到 相应 
的 元 系 。 如 果 skip 是 2， 调 用 next 时 则 需要 跳 过 第 一 个 元 系 ， 和 朋 接 到 第 二 
SICH. TERT US ASITIEA nth, WATERS BRAIN A 
nS ICR 

fe ROK, Tee Blt —Pstep TAK £EStepis bcs, Bis 6- 
B9ATAN - 

代码 清单 6-89: 创建 step 方 法 来 产生 Step 适 配器 
1 pub fn step<I>(iter: I, step: usize) => Step<I> 
2 where I: Iterator, 

3 { 

4. assert! (step != 0); 

om Step { 

6 iter: iter, 

F 
8 
9 


Skips sceo = ly 
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第 二 个 为 指定 步 数 。 返 回 一 个 Step 结 构 体 实例 。 
现在 ， 一 个 完整 的 迭代 器 适配器 已 经 创建 好 了 。 最 后 只 需要 为 所 有 
的 友 代 大 实 现 step 方 法 即 可 ， 如 代码 清单 6-90 所 示 。 
代码 清单 6-90: 为 所 有 的 迭代 器 实现 step 方 法 
1 pub trait IterExt: Iterator { 
2 fn step(self, n: usize) -> Step<Self> 
3 where Self: Sized, 
4 { 
Bhs step(self, n) 
6 } 
7 
8 


} 
impl<T: ?Sized> IterExt for T where T: Iterator {} 


代码 清单 ”6-90 ”做 了 两 件 事 。 第 一 件 事 是 目 定 义 了 一 个 继承 目 
Iterator 的 子 trait， 名 为 IterExt， 其 中 定义 了 step 方 法 并 给 出 了 默认 的 实 
H: 和 朋 接 使 用 step 函 数 创建 Step 适 配器 并 返回 。 第 二 件 事 如 代码 第 8 行 所 
示 ， 使 用 imp] 为 所 有 实现 了 Tteraotr 的 类 型 T 实 现 IterExt。 华 此 ， 整 个 从 代 
佛 适 配 妖 才 算 大 功 告 成 ， 可 以 直接 使 用 了 ， 如 代码 清单 6-91 所 示 。 

代码 清单 6-91: AIS as eh Ac a8 Step 


1 fn main() { 

2 let arr 基业 有 入 6) 3 

Ja let sum = arr.iter().step(2).fold(0, |acc, x| acc + x); 
4 assert eq!(9,; sum)? 47 (ll; 3; 5) 

D } 


在 代码 清单 6-91 中 ， 数 组 arr 通 过 iter 方 法 转换 为 和 迭 代 器 之 后 ， 束 可 
以 直接 调用 step 方 法 来 指定 达 代 的 步 数 了 ， 此 例 中 指定 步 数 为 2， 连 代 的 
元 系 应 该 古 [1，3，5]， 所 以 使 用 fold 消 费 占 对 其 求 和 所 得 值 等 于 9。 

以 上 束 是 目 定义 达 代 器 适 配 疾 的 具体 思路 。 

实际 上 ，Rust “社区 有 很 多 第 三 方 包 〈crate) EE TIARE A 
研 ， 其 中 最 稼 用 的 是 Itertoolgs。 代 码 清单 6-92 是 Itertools 包 中 实现 的 
Positionsi AC as BI o 


代码 清单 6-92: Itertools@, P SEIN HJ Positionsi& {C48 18 fic 4 


1. #[must use = "iterator adaptors are lazy and do nothing unless 
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consumed" ] 

# [derive (Debug) ] 

pub struct Positions<i, E> 1 
iter; Lp 
Ean Es 
count: usize, 


} 


Pub Fn. positions<1; E> @Gitezr: TIT, £t F) |-> Positions<i; F> 


where I: Iterator, 
Fz FnMut (Liesltem) => book, 
{ 
Positions { 
iter: iter; 
E: £, 
courre: © 


} 

impl<I; F> Iterator for Pesitions<I; E> 
where I: Iterator, 
Fs FnMut (ETssItem) => bool, 


type Item = usize; 
fn next (&mut self) -> Option<Self::Item> { 
while let Some (v) = self.iter.next() { 
let i = self.count; 
self.count = i + 1; 


if (Self. EJ Coy l 
return Some (i); 


} 


None 


} 
fn size hint (&self) -> (usize, Option<usize>) { 
(0, selt.iter.size hint (¢) .1) 


} 

impl<I, F> DoubleEndediterator for Positions<I, F> 
where I: DoubleFndediIiterator + ExactSizelIterator, 
FP: FnMut (I2:Ttem) => bool, 


fn next back (émut self) -> Option<Self::Item> { 
while let Some (v) = self.iter next back() 二 


i£ (selt.t) tv) 1 
return Some(self.count + self.iter.len() ) 


None 


pub trait Itertools: Iterator { 


fn positions<P>(self, predicate: P) -> Positions<Self, 


P> 


Ge where Self: Sized, 


39 P: FnMut (Self::Item) -> bool, 
54. { 

Ia positions (self, predicate) 
SG. } 

Die | 


58. impl<T: ?Sized> Itertools for T where T: Iterator {} 
59. fn main() { 


60. Let. data = TE [lh 2, sy oy 4 Gs 7, Bl? 

61. let r = data.iter().positions(|v| v % 3 == 0); 

GZ. lec Tee r = ata, Teer) «positions ( |v] Y 7 3 == Carer): 
63. LOY 4 in £ 4 Brintini eee", LIP | Jf GUIPUT: 2 2 5 7 
64. for 1. in Bey © T pELnCIML (T[i; ir OT 7 5 3 2 
Boe | 
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完整 实现 ， 从 main 国 数 中 可 以 看 出 ， 其 功能 是 输出 满足 财 包 内 指定 条 件 
TUANAS| OLED o 

第 3 行 到 第 7 行 定 义 了 Positions 结 构 体 ， 包 含 三 个 成 员 字 段 。 其 中 iter 
用 来 存储 迭代 硕 ， 人 来 存储 财 包 ，count 用 来 计数 。 

第 8 行 到 第 17 行 实现 了 positions 方 法 ， 用 来 生成 Positions 迭 代 霹 实 
例 。 

第 18 行 到 第 36 行 为 Positions 实 现 了 Iterator 中 核心 的 next 方 法 和 
size_hint 方 法 。 注 意 其 中 的 next 方 法 ， 在 每 次 迭代 时 ， 会 使 用 count 来 进 
行 计 数 并 执行 财 包 ， 如 果 满 足 财 包 条 件 则 返回 相应 的 计数 ， 融 是 所 得 过 
Sloe 

第 37 行 到 第 49 行 为 Positions 实 现 了 DoubleEndIterator 和 
ExactSizeIterator， 文 持 反 回 遍 历 和 确定 迭代 器 大 小 。 

第 50 行 到 第 57 行 创建 了 Itertools， 其 继承 自 Iterator 的 子 trait， 作 用 是 
扩展 Iterator。 该 trait 实 现 了 positions 方 法 ， 连 代 器 束 可 以 调用 了 。 

在 main 函 数 中 ， 第 61 行 和 第 62 行 分 列 使 用 了 positions 方 法 正确 获得 
Positions 从 代 血 ， 并 在 其 后 的 两 个 for 人 循环 中 获得 预期 的 结 来 。 

除了 Positions 适 配 磊 ，Itertools 还 提供 了 更 多 的 适 配 右 和 其 他 扩展 达 


代 器 的 方法 。 如 有 和 需要， 可 以 在 crates.io 网 站 找到 它 。 


6.4 小 结 


本 章 从 函数 式 编 程 泡 式 的 角 撒 探讨 了 Rust 中 的 冰 数 和 闭 包 。 在 Rust 
中 ， 函 数 是 一 等 公民 ， 可 以 作为 其 他 函数 的 参数 或 返回 值 。 将 函数 作为 
参数 或 返回 值 的 困 数 ， 叫 高 阶 函 数 。 在 函数 之 间 传 递 的 是 函数 指针 次 型 
fn。 里 然 Rust 也 支持 高 阶 疯 数 ， 但 是 函数 本 里 并 不 能 捕获 环境 变量 ， 无 
法 完成 菏 些 情况 下 有 的 需求 ， 所 以 Rust 也 引入 了 闭 包 。 

闭 包 可 以 捕获 其 在 外 定 义 时 环境 中 的 变量 。 在 Rust 中 ， 闭 包 实 际 上 
是 一 种 trait 语 法 糖 。 对 应 所 有 权 系 统 ， 闭 包 有 三 个 trait， 分 别 是 Fn、 
FnMut、FnOnce， 它 们 由 编译 占 目 动 生成 。 生 成 哪 种 类 型 风 团 包 ， 与 捕 
医 和 变量 属于 复制 语义 还 是 移动 语义 有 关联 。 闭 包 也 可 以 作为 函数 的 参数 
和 返回 值 ， 这 台 极 大 地 提高 了 Rust 语 言 的 抽象 表达 能 力 。 但 是 因为 财 包 
是 trait 语 法 糖 ， 所 以 在 返回 闭 包 的 时 候 ， 需 要 把 团 包装 箱 用 作 trait 对 
象 。 闭 包装 箱 会 币 来 性 能 问题 ， 所 以 Rust 官 方 团队 在 Rust 2018 版 本 中 可 
A Simpl Trait 功 能 ， 来 支持 直接 返回 闭 包 ， 而 不 再 需要 trait 对 象 。 顾 名 
WX, impl Trait 代 表 实 现 了 指定 Trait (比如 财 包 的 Fn、FnMut、 
FnOnce)〉 的 类 型 ， 它 类 似 返 回 值 上 的 trait 限 定 ， 属 于 表态 分 发 。 

闭 包 最 遇见 的 应 用 就 是 迭代 右 ，Rust 达 代 右 的 应 用 非常 三 沁 。Rust 
基于 trait 和 结构 体 非常 深 融 地 实现 了 达 代 器 模式 ， 以 及 达 代 器 适 配 絮 模 
式 ， 不 仅 在 标准 库 中 提供 了 很 多 欠 代 堪 相 关 的 方法 ， 而 且 开 及 者 还 可 以 
非常 方便 地 编写 目 己 的 从 代 楷 适 配 磊 ， 来 扩展 Rust 的 迭代 右 。Rust 磊 代 
旬 是 基于 for 循 环 的 外 部 迭代 需 ，for 循 环 其 实 也 是 语法 糖 ， 它 会 目 动 调 
Fanext J yER JAR Bas NIC 

Rusthhi& Tas MIA eee ee, hits, WMRRAR 
IEW RAMIT ARE, ENDER LEN. XH TI BIA as Bo 
HACR Seas. Ruste SABRE JLAHIA Seas, FÉ a collect#lfold. 
XEY Be as Se by EA AN IA as A IAT as HY fh ce NS 5 FF 
return、break 利 continue， 减 少 了 相关 的 检查 ， 可 以 方便 编译 器 进行 优 
化 ， 在 荣 些 场景 中 提升 性 能 。 这 些 内 部 友 代 需 实 际 上 是 基于 for 循 环 实现 
Hy. std: : iter 柑 块 中 还 定义 了 很 多 友 代 需 相 关 的 方法 ， 访 者 可 以 目 行 
探索 和 练习 。 


HI FPA. BAMAR AMZA Rust 了 更 深 的 认识 ， 
也 应 该 能 更 进一步 地 体会 到 Rust 语 言 设 计 的 一 致 性 了 。 基 于 trait、 结 构 
体 和 所 有 权 ， 完 闫 地 提供 了 函数 式 编程 范式 中 的 沼 用 融 级 语言 特性 ， 也 
证 这 正 丰 Rust 语 言 有 的 优雅 性 所 在 。 


第 7 章 结构 化 编程 


形 每 万 变 ， 神 唯 守 一 。 

彤 程 是 一 门 扩 术 ， 用 它 可 以 解 次 很 多 问题 ， 创 造 很 多 新 事物 ， 其 全 
改变 世界 。 编 程 更 是 一 门 乞 术 ， 在 使 用 它 解 决 问题 或 创造 新 事物 的 时 
候 ， 本 号 吏 是 一 种 精神 实践 活动 ， 其 中 给 侣 了 开 及 着 对 于 客观 世界 的 认 
识 和 反映 。 在 外 行人 的 眼 星 ， 由 26 个 英文 字母 加 各 种 符号 组 合 而 成 的 
程序 代码 可 能 坚 无 夫 感 可 言 ， 那 么 编程 的 艺术 性 到 撒 表 现在 哪里 ? 对 于 
开 及 者 来 阅 ， 编 程 的 艺术 性 在 于 其 组 织 结 构 极 具 审 类 价值 。 

编程 完全 可 以 类 比 建筑 。2010 年 上 海 世 博 会 上 ， 中 国 馆 “ 东 方 之 
款 ” 给 人 留 下 了 深刻 的 印象 。“ 东 方 之 疯 ” 的 特色 之 处 在 于 其 及 用 了 中 华 
百 建 禹 斗拱 的 结构 ， 如 图 7-1 所 示 。 





图 7-1: 中 国 古 建筑 斗拱 结构 示意 图 
斗拱 属于 桦 卯 结构 的 一 种 ， 其 上 承 屋顶 ， 下 接 立柱 ， 在 中 国 十 建筑 
中 扮演 的 是 顶天立地 的 角色 。 而 斗拱 仅仅 由 5 个 简单 的 部 件 组 成 ， 利 用 
独一无二 的 桦 卯 结构 ， 可 以 拼接 出 种 类 繁多 且 左 右 对 称 的 各 种 样式 ， 无 


不 令 人 称赞 。 这 正 应 了 “ 形 每 万 变 ， 神 唯 守 一 ”的 规律 。 

编程 也 一 样 ， 同 样 般 要 考虑 系统 结构 、 分 层 和 架构 。 无 论 古 采用 面 
器 对 象 还 十 函数 式 的 开 友 思想 ， 可 以 代码 复 用 和 噩 内 聚 低 烽 合 的 架构 就 
旦 一 种 类。 而 语言 的 范式 在 很 大 程度 上 决定 了 使 用 该 语言 编写 出 的 代码 
的 组 织 结构 。 对 于 面 同 对 象 范式 的 语言 ， 其 核心 的 概念 是 继承 、 多 态 和 
封 当 ， 它 将 对 象 作为 程序 的 基本 构建 单元 。 而 函数 式 江 式 语 诗 将 函数 作 
为 其 程序 的 基本 构建 单元 ， 采 用 抽象 和 复合 等 手段 来 组 织 和 复 用 代码 。 
这 两 种 方式 各 有 优 身 点 。 面 癌 对 象 范 陈 在 代码 结构 化 方面 的 优点 在 于 更 
加 符合 卫 觉 ， 缺 后 是 性 能 过 、 过 度 封 农 ， 而 基于 类 继承 的 方式 也 会 造成 
强 帮 合 。 国 数 却 范式 的 优 氮 在 于 它 的 核心 思想 是 “组 合 优 于 继承 ”， 与 面 
问 对 象 范 坏 相 比 ， 其 复 用 的 粒度 更 小 ， 更 目 由 灵活 ， 帮 合 程度 更 低 ， 但 
其 缺 后 十 学 习 成 本 比较 融 。 

作为 现代 系统 级 的 编程 语言 ，Rust 汲 取 了 两 个 不 同 编程 范式 的 优 
势 ， 提 供 了 结构 体 、 枚 举 体 和 trait 这 三 萄 马车 来 撑 起 程序 结构 。 本 章 主 
要 围 经 结构 体 和 枚 举 来 阐述 如 何 使 用 Rust 进 行 结构 化 编程 。 


7.1 面 回 对 象 风 格 编 程 


严格 来 说 ，Rust 并 不 符合 标准 的 面 癌 对 象 语 言 的 定义 。 比 如 ，Rust 
既 不 存在 类 或 对 象 的 概念 ， 也 没有 父子 继承 的 概念 。 然 而 ，rust 却 文 持 
面 回 对 象 风 格 的 封 狼 。 传 统 面 回 对 象 中 的 父子 继承 是 为 了 实现 代码 复 用 
和 多 态 ， 其 本 质 在 类 型 系统 概念 中 属于 子 类 型 多 态 ， 而 Rust 使 用 trait 和 
泛 型 提供 的 参数 化 多 态 焉 完全 满足 了 这 个 需求 。 对 于 代码 复 用 ，Rust 坪 
通过 泛 型 单 态 化 和 trait 对 象 来 避免 代码 重复 ， 从 而 文 持 代 但 复 用 的 ， 虽 
然 相对 于 传统 面 同 对 象 语言 中 的 父子 继承 来 说 功能 较 轮 ， 但 Rust 还 提供 
了 功能 强大 的 宏 〈( 包 括 macro 和 procedural macro) 系统 来 帮助 复 用 代 
人 码 ， 甚 爹 还 可 以 使 用 一 些 设计 模式 来 避 倪 代码 重复 。Rust 还 实现 了 一 种 
名 叫 特 化 (specialization ) 的 功能 来 增强 代码 的 高 效 复 用 。 

总 而 言 之 ，Rust 对 面 癌 对象 编 程 风 格 的 文 持 可 以 总 结 为 以 下 几 点 。 

封装 。Rust 提 供 了 结构 体 〈Struct) 和 枚 举 体 (Enum) 来 封装 数 
据 ， 并 可 使 用 pub 关 键 字 定义 其 字段 可 见 性 ;提供 了 impl 关 键 字 来 实现 
数据 的 行为 。 

-ZN 。 通 过 trait 和 泛 型 以 及 枚 淮 体 “Enum) 来 允许 程序 操作 不 同 
类 型 的 值 。 

代码 复 用 。 通 过 泛 型 单 态 化 、trait 对 象 、 宏 (macro) 、 语 法 扩展 
(procedural macro) 、 人 代码 生成 (code generation) 来 设计 模式 。 


7.1.1 结构 体 


结构 体 〈Struct) PME (Enum) 是 Rust 中 和 最 基本 的 两 种 复合 类 
型 。 对 于 Rust 类 型 系统 而 言 ， 这 两 种 复合 类 型 实际 上 属于 同一 种 概念 ， 
它们 都 属于 代数 数据 类 型 (ADT ，Algebraic Data Type )。 代 数 数据 
类 型 的 概念 来 自 函 数 式 语言 ， 尤 其 在 Haskell 中 应 用 最 三 ， 仪 明 过 这 两 种 
数据 类 型 束 可 以 构造 出 大 部 分 的 数据 结构 。 

代数 数据 闫 型 之 积 类 型 

代数 数据 类 型 束 是 指 具 备 了 代数 能 力 的 数据 类 型 ， 即 数据 类 型 可 以 
进行 代数 运算 并 满足 一 定 的 运算 规则 《例如 可 以 进行 加 法 或 乘法 ， 满 足 


交换 律 和 结合 律 ) 。 正 是 这 一 点 保证 了 数据 类 型 中 的 许多 性 质 是 可 以 复 
合 ” 的。 比如 一 个 结构 体 中 包含 的 成 员 部 十 拥 有 复制 语义 的 简单 原始 数 
据 类 型 ， 那 么 这 个 结构 体 也 可 以 通过 派生 属性 #[derive] 来 放心 地 为 其 
实现 Copy， 如 代码 清单 7-1 所 示 。 

代码 清单 7-1: 成 员 和 字段 为 镜 单 原始 数据 类 型 的 结构 体 示例 


1 # [derive (Debug,Copy,Clone)] 
2 struct Book<"a> 1 
eT name: &'a str, 
4 Leone 132; 
5 version: 132, 
6 } 
Te £n WO 
8. let book = Book { 
9 . name: "Rust 编程 之 道 " , isbn: 20181212, version: 1 
LG }; 
LE let book2 = Book { version: 2, ..book}; 
dat Piru (ieee pD} 
LS. prinelna! ("I Beaks) ; 
14. } 


在 代码 清单 7-1 中 ， 因 为 结构 体 Book 的 成 员 字 段 均 为 复制 语义 的 
关 型 ， 所 以 在 代码 第 12 行 输出 book 时 ， 可 以 正 第 编译 执行 ， 说 明 第 11 行 
创建 book2 时 ， 使 用 结构 体 更 新 语法 “..” 时 ，book 的 所 有 权 并 未 被 转移 。 
结构 体 的 更 新 语法 (update syntax ) 允许 使 用 “..” 语 法 来 减少 代码 重 
复 。 

这 说 明 复 合 类 型 结构 体 Book 己 经 通过 派生 属性 # [derive (Copy, 
Clone) ] 实现 了 Copy。 但 是 如 果 结 构 体 Book 使 用 了 移动 语义 的 成 员 字 
段 ， 则 不 允许 实现 Copy， 如 代码 清单 7-2 所 示 。 

代码 清单 7-2: 成 员 字 段 为 移动 语义 的 情况 


1. #[derive (Debug, Copy, Clone) ] 

2 struct Book: { 

3 name: String, 

4 isone 134 

De version: 132, 

6. |} 

7 fn main() { 

8 let book = Book { 

9 . name: "Rust #42Z2i@".to string() , isbn: 20171111, version: 1 
LU s RE 

Er; let book2 = Book { version: 2, ..book}; 

12% // error[E0382]: use of partially moved value: ‘book’ 
1.3 ， PELAGIA: (Sissi book); 

14, princin I ll oo) 

ETE 


在 代码 清单 7-2 中 ， 将 结构 体 Book 的 name 字 上 段 修改 为 了 拥有 移动 语 
义 的 String 关 型。 该 代码 编 详 会 报 以 下 错误 : 
error[E0204]: the trait ‘Copy may not be implemented for this type 
1 | #[derive (Debug, Copy, Clone) ] 
| BAAN 
Z | Struct Book { 
3 | name: String, 
E this field does not implement `Copy` 
错误 信息 表明 ，Rust 个 允许 包含 了 String 类 型 字段 的 结构 体 实现 
Copy。 看 得 出 来 ， 代 数 数据 类 型 有 力 地 保障 了 复合 类 型 的 类 型 安全 。 这 
里 值得 注意 的 是 ， 更 新 语法 会 较 移 字段 的 所 有 权 。 在 代码 清单 7-2 的 第 
11 行 中 ，..book 语 法 会 将 除 version 字 段 之 外 的 其 他 字段 的 所 有 权 转 移 ， 
这 里 name 是 String 类 型 ， 属 于 移动 语义 ， 所 以 name 会 被 转移 所 有 权 。 如 
菏 把 代码 清单 7-2 结构 体 的 派生 属性 #[derive (Copy, Clone) ] 去 挥 ， 
再 编译 该 代码 ， 则 会 报 出 代码 第 ”12 行 注释 展示 的 错误 ， 表 示 book 的 部 
分 字段 的 所 有 权 已 经 被 转移 。 
Rust 中 的 结构 体 属于 代数 数据 类 型 中 的 积 类 型 PARA EK A y 


论 的 术语 ， 毕 况 Rust 类 型 系统 借鉴 了 Haskell 语 言 ， 而 Haskell 语 言 是 范畴 


论 的 了 最 佳 实践 ， 但 这 并 不 代表 需要 深入 Haskell 或 苑 畴 论 才 能 理解 它 。 积 
类 型 也 可 以 通过 更 直观 的 乘法 原理 来 理解 ， 假 如 一 件 事 需要 分 成 n 个 步 
又 来 完成 ， 第 一 步 有 mm 1 种 不 同 的 做 法 ， 第 二 步 有 m > 种 不 同 的 做 法 ， 
此 类 推 ， 第 n 步 有 m 种 不 同 的 做 法 ， 那 么 完成 这 件 事 共 有 N =m 1 xm > 
XM 3 x...xmn 种 不 同 的 做 和 法， 这 吏 是 乘法 原理 。 它 摘 述 的 是 做 一 件 事 需 
要 分 成 很 多 步 ， 每 一 步 之 间 都 相互 依 顿 ， 它 表示 的 是 一 种 组 合 
(combination) 。 如 果 用 逻辑 来 表示 ， 则 是 进 辑 与 〈 合 取 ) 。 

同 理 ， 结 构 体 这 样 的 复合 数据 是 通过 不 同 字 段 的 值 组合 而 成 的 。 比 
如 一 个 元 组 结构 体 S G32, u32, String) ， 其 实例 是 〈i32，u32， 
String) 这 三 种 字段 次 型 的 值 相互 依赖 而 成 的 不 同 组 合 。 由 此 可 知 ， 元 
组 也 属于 积 闫 型。 积 闫 型 代表 一 种 数据 结构 的 复合 方式 ， 当 一 个 复合 类 
型 需要 组 合 多 个 成 员 来 共同 表达 时 ， 可 以 使 用 结构 体 。 

Rust 中 的 结构 体 虽 然 是 代数 数据 次 型 ， 但 也 契合 了 面 问 对 象 思 想 
的 封装 。 因 此， 通过 结构 体 完全 可 以 进行 面 同 对 象 风格 的 编程 。 

使 用 结构 体 进行 面 回 对 象 风 格 编 程 

下 面 以 一 个 简单 的 示例 来 说 明 如 何 使 用 结构 体 进行 面 同 对 象 风 格 的 
Hike. AU SES VARIN Te EEA iy (Terminal) 输出 指 
REEL AALS FS RE FY PS Oo Sa 7-3 
ZN o 

代码 清单 7-3: TE 2 im Har HH Fa RE ET ASN R 


L. ££ Maan() 4 

Z let hi = “Hello™.red().on yellow () ; 
3 princin" Ee». Bayz 

4 } 


代码 清单 7-3 想 实现 的 是 在 该 代码 运行 时 ， 在 终 闯 输出 指定 闫 色 的 
字符 ， 其 体 来 说 ， 是 想 在 终 闪 输出 黄色 背景 色 下 的 红色 字符 串 Hello。 
那么 该 如 何 设计 代码 才能 实现 此 目标 呢 ? 

EAE EMEI, mE HANSIE XJF YI (ANSI 
Escape Code ) 。ANSI 转 义 友 列 束 是 指 形 如 ESC 和 [ 组 合 而 成 的 字符 序 
Mi), AY DA SETAE BE AE FE 0G i Be ea LH A Se, A DA ta 


称 为 控制 字符 ， 被 定义 于 ASCII 码 中 。ESC 有 三 种 表示 方法 : 
在 Shell 中 表示 为 \e 。 
- 以 ASCII 十 六 进 制 表 示 为 \x1B 。 
` 以 ASCII 八 进 制 表示 为 \033 。 
所 以 ， 如 果 想 在 终 曾 输出 禹 指定 闫 色 的 字 从 Hello， 需 要 将 其 变 为 
包含 ANSI 转 义 序 列 的 字符 串 ， 如 下 所 示 : 
S echo "\e[31;43mHello\e[0Om" 
S echo "\x1B[31;43mHello\x1B[0m" 
S echo "\033[31; 43mHello\033[0m" 
将 这 三 条 echo 指 令 放 到 Linux 终 六 下 ， 均 会 输出 贡 抵 红字 的 Hello。 
IBI 为 前 经， 表示 这 是 一 个 ANSI 控 制 序列 的 开始 。 用 分 号 相隔 的 
31; 43 ”属于 颜色 代码 ，31 是 前 景色 ， 代 表 红 色 ; 43 为 背景 色 ， 代 表 黄 
色 。 字 母 m 为 结束 符 ， 原 始 文本 Hello 置 于 其 后 。 最 后 的 \x1B[0m 结尾 代 
表 重 置 全 部 属性 ， 表 示 一 个 ANSI 控 制 序列 的 结束 。 图 7-2 以 ESC 的 十 六 
进 制 表示 为 例 展 示 了 ANSI 转 义 序 列 的 含义 。 


ANSI 转 义 序列 


控制 字符 的 一 部 分 结束 符 © iS abe tt 


— 
\x1B [ 31;43 Hello \x1B[ Om 
| | 


| 


ESC 的 ASCII 颜色 代码 文本 
六 进 制 表示 





图 7-2: ANSI 转 义 序 列 示 意 
那么 ， 想 把 Hello 转 换 为 此 ANSI 序 列 ， 实 际 上 就 是 一 个 字符 串 的 组 
小 。 整 个 ANSI 序 列 中 动态 变化 的 只 有 两 部 分 ， 那 束 古 闫 色 代 码 和 原始 
文本 ， 因 此 有 了 初步 的 实现 步 又 : 
1. 定 义 一 个 结构 体 ， 来 封装 动态 变化 的 两 部 分 数据 。 


2 AU VRE SERIE TIA, kired 77% Mon_yellow/7 
ae 

3. 为 了 实现 直接 在 字符 串 字 耐量 上 链 式 调用 red 和 on_yellow 方 法 ， 
就 必须 为 & astr 类 型 也 实现 red 和 on_yellow 方 法 。 

4. 为 此 结构 体 实现 方法 ， 用 于 组 竣 ANSI 字 人 符 串 序列 。 

5. 打 印 结 来 。 

接 下 来 ， 按 照 此 步骤 来 逐步 实现 目标 。 创 建 一 个 名 为 color.rs 的 文 
件 存放 整个 代码 ， 注 意 Rust 代 码 文件 以 .rs 为 扩展 名 。 

第 1 步 来 设计 一 个 结构 体 ， 命 名 为 ColoredString， 字 段 包 侣 输入 的 原 

字符 串 ， 以 及 前 景色 和 背景 色 ， 如 代码 清单 7-4 所 示 。 
代码 消音 7-4: 在 color.rs 文 件 中 创建 ColoredString 结 构 体 


lL. BEZUGE CEOleredsering 4 


Bis input: String, 
Sy recolers Dh yr: 
4. boacolor: String, 
oe } 


结构 体 ColoredString 包 侣 三 个 字段 ， 均 为 String 类 型 。 其 中 input 用 于 
存储 原始 字符 ，fgcolor 和 bgcolor 分 别 代 表 前 景色 和 背景 色 。 

第 2 步 要 为 结构 体 实现 磊 色 相关 的 方法 ， 而 第 3 步 中 也 需要 为 &' a 
str ”类 型 实现 相关 方法 ， 因 此 这 里 实际 上 需要 一 个 统一 的 接口 ， 这 正 古 
trait 大 显 续 手 的 地 方 ， 我 们 增加 Colorize ”trait， 如 代码 清 蛙 7-5 所 示 。 使 
用 Rust 的 trait 可 以 实现 非 侵 入 式 接 口 ， 而 不 是 面 同 对 象 语言 《比如 
C++ 或 Java) 的 那 种 有 过 多 依赖 的 侵入 式 接口 。 

代码 清单 7-5: 在 color.rs 中 增加 Colorize trait 


1. trait Colorize { 


fw const FPG RED y &’static str = "SL"; 

Sw const BG YELLOW ¢: &*static str = "43"; 
4. fn red(self) -> ColoredString; 

a fn on yellow(self) -> ColoredString; 
cP } 


代码 清单 7-5 定 义 了 这 个 Colorize trait， 该 trait 包 含 了 FG_RED 和 


BG_YELLOW 两 个 常量 ， 这 两 个 常量 叫 关 联 常量 > AUK ee Rust 
2018 版 本 中 加 入 的 新 功能 ， 和 关联 类 型 类 似 ， 由 实现 该 trait 的 类 型 来 指 
定常 量 的 值 ， 也 可 以 像 代 人 码 清 蛙 7-5 这 样 指 定 默 认 常 量 值 。 这 里 的 两 个 
党 量 值 分 别 代 表 前 景色 红色 和 背景 色 嘻 色 ， 在 后 面 的 代码 中 将 会 使 用 。 
与 直接 在 代码 中 使 用 数值 相 比 ， 关 联 常 量 的 可 读 性 和 可 维护 性 更 局 一 
些 。 在 使 用 关联 第 量 的 时 候 ， 要 注意 音量 名 必须 全 部 大 写 ， 人 否则 编 详 需 
会 得 出 警告 。 并 且 在 trait 中 要 明确 标注 好 第 量 的 类 型 ， 因 为 此 处 编译 翰 
FOIE FET ih Bt A ARR , 

trait FIA ELS PS rikred#llon_yellow, 2s) AH Fix ws ey 
景色 。 这 两 个 方法 均 以 self 为 第 一 个 参数 并 返回 ColoredString， 表 示 充 方 
法 是 和 实现 该 trait 的 类 型 相关 联 的 函数 ， 其 中 self 实 际 上 代表 self: Self, 
Self 代 表 实 现 该 trait 的 类 型 。 这 是 Rust 最 具有 面 回 对 象 风 格 的 特点 的 地 
方 ， 因 为 关联 图 数 允 许 开 及 者 使 用 点 操作 人 符 来 调用 函数 ， 同 样 也 文 持 链 
式 调 用 ， 束 像 使 用 面 癌 对象 语 言 那样 。 在 面 同 对 象 语 言 中 ， 形 如 
recevier.message 形 了 式 的 调用 方式 航 称 为 消息 传递 ， 点 操作 符 左 边 的 
recevier 被 称 为 接收 者 ， 石 边 的 部 分 锐 称 为 消 上 忠 ， 在 面 同 对 象 语言 中 ， 
消 奶 也 被 叫 作 方 法 。 因 此 我 们 把 这 样 的 天 联 函 数 称 为 方法 ， 用 于 和 普通 
的 国 数 区 分 开 来 。 

IK Fa ZL) Fill AColoredStringfl&’ a str 类 型 实现 Colorize。 这 里 思 
考 一 个 问题 ， 当 实现 red 方法 时 ， 只 需要 设置 前 景色 fgcolor， 而 另外 两 
个 值 却 不 知道 ， 原 始 文本 有 可 能 是 任意 字符 串 ， 育 景色 bgcolor 可 以 议 
置 ， 也 可 以 不 设置 。 同 理 ， 实 现 on_yellow 方 法 也 存在 类 似 的 问题 ， 所 
以 必须 使 用 默认 值 。 最 直观 的 办 法 是 使 用 空 字 符 串 充当 默认 值 ， 类 似 如 
下 代码 : 

ColoredString{ 
input: String::new(), 
igeolort SESIO croem (Msi), 
bgcolor: String: snewt{), 

} 

为 red 和 on_yellow 方 法 返回 的 均 为 ColoredString 实 例 ， 如 果 用 这 种 
方法 ， 必 然 会 出 现 重 复 代 码 ， 为 了 减少 这 种 重复 ， 可 以 使 用 结构 体 更 新 
语法 来 隐 式 填充 重 复 的 字段 ， 与 法 类 似 下 面 这 样 : 


ColoredString{ ftocoler: Strang::From("3si"), «.seLr 1 
Coloredstrang, bocolor: Strangitirom("45"), geli | 


但 是 Rust 并 没有 为 结构 体 提 供 类 似 C++ 或 其 他 面 问 对 象 编 程 语 言 中 
的 构造 函数 ， 在 实现 red 或 on_yellow 方法 时 ， 如 何 提供 默认 值 ? Rust 
标准 库 std: : default 模块 中 提供 了 一 个 叫 作 Default 的 trait， 可 以 帮助 
解决 此 问题 。 使 用 Default 可 以 为 ColoredString 提 供 默认 值 ， 代 码 清单 7-6 
展示 了 如 何 为 ColoredString 实 现 Default。 

代码 清单 7-6: 在 color.rs 中 为 ColoredString 实 现 Default 


1 impl Default for ColoredString { 
2 fn default() -> Self { 
3 ColoredString { 
d. INpuE? String: sdefault(), 
5 EqvelLor: SOA :detauLet), 
6 bgcolor: String::default(), 
7 } 
Si } 
Ze j 


因为 Default 己 经 在 std: : prelude: : v1 模块 中 被 导入 ， 所 以 这 里 
束 可 以 直接 使 用 而 不 需要 显 式 地 号 入 Default。Rust 己 经 为 内 置 的 大 部 分 
类 型 实现 了 Default ， 所 以 在 代码 清单 7-6 中 ， 可 以 使 用 String: : default 
方法 来 设置 String 关 型 的 默认 值 。 接 下 来 项 可 以 正式 为 ColoredString 和 人 & 
' a str 实 现 Colorize 了 ， 如 代码 清单 7-7 所 示 。 

代码 清单 7-7: 在 color.rs ”中 为 ColoredString 和 &' a ”str 实现 
Colorize 


1. aimpl<'a> Colorize for ColoredString { 

Ls fn red(self) -> ColoredString { 

3.5 ColoredString{ 

4, tocalo: String::from(ColoredsString::FG RED); «SELT 
Ds } 

6. } 

Tg fn on yellow (self) => ColoredString { 

8. ColoredString { 

9 bgcolor: String::from(ColoredString::BG YELLOW), ..self 
LO, } 

ll. } 

l2. J 

13. impl<'a> Colorize for k'a str { 

14, fn red(self) -> ColoredString { 

15, ColoredString { 

16. fgcolor: String::from(ColoredString::FG RED), 
Lis Lnput: String: from!(self), 

18, ..ColoredString: default () 

19. } 

LN a } 

E fn on yellow(self) -> ColoredString { 

Le ColoredString { 

As bgcolor: String::from(ColoredString::BG YELLOW), 
24. inpute SLELO: Strom (SELE) 

25. ..ColoredString: :default () 

26. } 

Aha } 

2B. J 


如 条 只 需要 为 字符 串 设 置 前 景色 或 育 景色 中 的 茶 一 种 颜色 ， 那 么 只 
fie N&’ a str 实现 Colorize， 束 可 以 满足 像 " Hello" red O 这 样 的 
调用 。 但 是 如 果 和 希望 像 " Hello" red () .on_yellow () 这 样 通过 链 式 
调用 来 同时 设置 前 景色 和 背景 色 ， 束 需要 为 ColoredString 也 实现 
Colorize， 因 为 在 第 一 次 调用 之 后 ， 返 回 的 是 ColoredString 关 型 的 实例 ， 
ColoredString 必 须 实 现 Colorize 才 能 满足 这 样 的 链 式 调用 。 


代码 清 单 7-7 的 第 4 行 和 第 9 行 的 更 狐 语法 中 使 用 了 ..self， 而 代码 第 
18 行 和 第 25 行 的 更 新 语法 中 使 用 的 是 ..ColoredString: : default © 。 其 
中 的 区 别 很 容易 理解 ， 因 为 第 一 次 调用 red 或 on_yellow 方 法 的 是 字符 
串 ， 所 以 需要 调用 ColoredString 的 默认 值 来 进行 第 一 次 默认 填充 ， 如 果 
有 链 陈 调用 才 会 轮 到 ColoredString 类 型 ， 所 以 需要 用 self 来 保存 第 一 次 调 
用 时 候 的 设置 。 

另外 也 需要 注意 代 人 码 中 关联 稼 量 的 用 法 。 因 为 是 给 ColoredString 关 
型 实现 的 Colorize， 所 以 调用 天 联 常 量 必须 以 类 型 名 为 前 级 ， 即 
ColoredString: : FG_RED 和 和 ColoredString: : BG_YELLOW. È FÆ 
的 工作 就 是 要 将 原始 字符 串 组 装 为 ANSI 序列 ， 为 了 实现 这 一 点 ， 需 要 
为 ColoredString 实 现 compute_style 方 法 ， 如 代码 清单 7-8 所 示 。 

代码 清单 7-8: 在 color.rs ”中 为 ColoredString 实 现 compute_style 方 


法 

1 impl ColoredString{ 

2 En COmpute Style peset) -> otning i 

3 let mat res = String: rirom("\x1B["); 

4 let mut has wrote = false; 

Da IT ssel Be Lr emery) 1 

6 Yes.push Str (ssel Ts bgCOLOE) ? 

7 has Wrote = Crue; 

8 } 

9 LE Self. Egealer.1s empty() 1 

Led y if, tas wrote 4 ree. .push(’s')7 | 

kak s res: pusn strlésell.igcolor) z 

L2; } 

L3; res.push Hn" 

14. res 

| } 

LB J 

代码 清 单 7-8 为 ColoredString 实 现 的 compute_style 方 法 是 为 了 组 装 

ANSI 序 列 的 前 半 部 分 ， 也 就 古 \x1B[43; 31m o HAE aKa} EEH T 


级 \x1B KE LANSIFP VIPER, Je AEREA; 31 ，43 和 31 分 
别 代表 红色 前 景色 和 贰 色 背景 色 ， 用 分 号 相隔 。 结 束 符 m EREE FE iil 


字符 已 经 设置 完毕 。 有 前半 部 分 是 最 关键 的 ， 它 设置 好 以 后 ， 后 面 束 可 以 
案 跟 原始 文本 和 ANSI 的 属性 重 置 从 了 ， 后 面 的 部 分 要 在 最 终 打印 输出 
时 再 进行 拼接 。 

代码 清单 7-8 的 第 3 行 初 始 化 了 一 个 可 变 的 String 类 型 字 任 串 res， 并 
包含 了 ANSI 序 列 的 起 始 前 级 。 

代码 第 4 行 设 置 了 一 个 bool 类 型 的 变量 has_wrote， 用 于 判 靳 是 否 有 
bgcolor 的 设置 。 

代码 第 5 行 到 第 8 行 通 过 标准 库 中 String 类 型 默认 提供 的 is_empty 方 
法 ， 来 判断 结构 体 中 的 bgcolor 字段 是 侣 为 衬 。 如 末 不 为 衬 ， 则 说 明 设 
fa J Boe, f bgcolor 字段 的 值 通过 push_str 方法 拼接 到 res FIFE Ja 
面 ， 因 为 push_str 的 参数 需要 &str 类 型 ， 所 以 这 里 使 用 了 
&self.bgcolor， 里 然 是 &String 类 型 ， 但 它 会 目 动 解 引 用 为 &str 类 型 ， 同 
时 ， 将 has wrote 设置 为 true。 

代码 第 9 行 到 第 12 行 判断 fgcolor 字 段 是 否 为 宇 ， 如 果 不 为 空 ， 则 将 
fgcolor 的 值 拼接 到 res 字 人 符 吕 后面。 但 是 在 此 之 前 ， 还 需 判断 has_wrote 是 
BAR, WRAH, MEEN shel res 字符 串 后 。 这 里 需要 注意 的 
是 ， 对 于 ANSI 控制 符 来 说 ， 本 景色 和 背景 色 是 由 相应 的 代码 决定 的 ， 
和 它们 的 拼接 顺序 并 无 关系 。 所 以 ， 这 里 最 终 的 拼接 结果 是 43; 31 ， 
先 判 断 的 是 背景 色 ， 然 后 是 前 景色 。 其 实 如 果 反 过 来 ，31; 43 ”也 不 会 
Bee Ma SEN AR E 

第 13 行 和 第 14 行 分 别 加 上 结束 符 m  ， 并 返回 最 终 拼 接 好 的 字符 串 
res， 职 得 到 了 预期 的 ANSI 序 列 。 

最 后 ， 需 要 将 最 终 的 得 出 结果 拼接 出 完整 的 字符 串 \x1B[43; 
31mHello\x1B[0m ， 那 就 需要 为 coloredstring 实 现 Display， 如 代码 清单 7- 
9 所 示 。 

代码 清单 7-9: 在 color.rs 中 为 ColoredString 实 现 Display 

l; Use stadi stmt; 


2 impl fmt: :Display for ColoredString { 

3 fn tmt(éselt, £2 smut fmt::Formatter) -> tmtzr:rResult 4 
4 let mut input = &self.input.clone(); 

Ds Ley: tam Lb BEE (LL Om Bry led) ))2 

6 CEPTE WELES St 

7 try! (f.write str ("\x15 LOm yy) 

8 Ok(()) 

9 } 


Ie 3 

Display 是 定义 于 std: : fmt 中 的 trait， 它 和 Debug 很 相似 。Debug 是 
专门 用 于 格式 化 打印 的 trait， 通 过 {: ? } 来 格式 化 打印 指定 的 输出 ， 其 
中 的 ? 代表 Debug 模 式 ， 在 本 书 中 己 经 用 到 过 很 多 次 了 ，Debug 可 以 通 
iw # [derive (Debug) ] BIEKA VRE. mM Display M4 来 格式 化 
打印 的 ， 它 比 Debug 适 用 的 范围 更 三 ， 更 常用 于 手工 实现 而 非 目 动 派 
Æ, 

代码 清单 7-9 是 一 个 标准 的 实现 Display 的 例子 ，fmt 方 法 使 用 &self 作 
为 第 一 个 参数 ， 第 二 个 参数 为 fmt: : Formatter 类 型 ， 是 一 个 结构 体 ， 
专门 用 于 提供 记录 格式 化 相关 的 信息 ， 比 如 提供 了 write_str， 用 于 将 指 
定 的 数据 记录 到 底层 的 缓冲 区 中 。fmt 方法 返回 的 fmt: : Result 类 型 是 
和 Option<T 之 相似 的 闫 型， 专门 用 于 铬 误 处 理 。 

代码 第 4 行 声 明 了 input 变 量 ， 用 来 存储 ColoredString 结 构 体 实例 中 
input 字 段 所 记录 的 原始 文本 。 

代码 第 5 行 到 第 7 行使 用 write_str 方 法 ， 依 次 将 ANSI 序 列 的 前 半 部 
分 、 原 始 文 本 和 ANSI 序 列 属性 重 置 从 及 入 夺 层 绥 冲 区 中 。 其 中 用 到 了 
try! 宏 ， 它 是 Rust 标 准 库 提 供 的 专门 用 于 错误 处 理 的 宏 ， 如 果 出 现 错 
误 ， 会 目 动 返回 相应 的 Er， 后 面 错误 处 理 的 章节 会 介绍 更 多 相关 内 
容 。 代 码 第 8 行 返回 Ok CO ) ， 表 示 正 常 结束 。 

OR Amain K a, Yi 47-10At ma. 

Ria 47-10: 在 color.rs 中 添加 main 函 数 


1 fn main() { 

2 Llet ha = “"Hello”®.red{).on. yellow {) ; 
3 Orin ls ey ML? 

| let hi = "Hello”™.on yellow () ; 

Piss Pranelnt("{}", Mas 

6 let ha = “Hello” .red{}: 

7 Srila Le» Daf 

Bis let hi = "Hello™.on yellow() .red(); 
Da 和 


Le J 


his 427-10 FAA S maini 2c, BY LA A hihi redekon_yellow 
TEIFI FB AF ET EANSIP2 HI, (SESE A ig Ay LT Sa AN A DV 
颜色 。 可 以 通过 rustc 命令 来 编译 color.rs 文 件 ， 如 下 所 示 : 
= LMSES COler rs 
S ,/coler 
编译 通过 以 后 ， 直 接 执行 得 到 的 二 进 制 文件 ， 即 可 观察 到 最 终 运 行 
结果 ， 正 如 所 预期 的 那样 。 通 过 这 个 简单 的 示例 ， 我 们 可 以 对 Rust 中 使 
用 结构 体 和 trait 进 行 面 回 对 象 风 格 编程 有 一 个 整体 的 了 解 。 
但 是 目前 的 代码 功能 有 限 ， 如 果 想 让 它 文 持 显 示 更 多 的 两 色 ， 访 如 
何 扩展 现 有 的 代码 呢 ? 不妨 考 上 处 使 用 枚 举 体 ， 也 可 称 为 枚 举 类 型 或 枚 


7.1.2 枚 举 体 


MASS (Enum) 是 Rust 中 除 结构 体 之 外 的 另 一 种 重要 的 复合 类 
AY. Rust 之 父 Graydon 曾 经 这 样 评 价 枚 举 体 : “一 门 不 文 持 枚 举 体 的 语 
言 堪 比 一 场 翡 剧 ， 想 想 如 果 没 有 lambda 会 发 生 什 么 。”Graydon 把 枚 举 体 
看 得 和 lambda 一 样 重 要 ， 可 想 而 知 枚 举 体 的 重要 性 。 事 实 也 确实 如 此 ， 
枚 举 体 让 Rust 更 简洁 ， 拥 有 更 强大 的 表现 力 。 

代数 数据 类 型 之 和 类 型 

枚 举 体 属于 代数 数据 奖 型 中 的 和 类 型 (Sum Type) 。 积 类 型 可 以 
借助 乘法 原理 来 理解 ， 而 和 类 型 正好 可 以 借助 加 法 原理 来 理解 。 加 法 原 
H 是 指 ， 如 果 做 一 件 事 有 mn 类 办 法 ， 在 第 一 类 办 法 中 有 m 1 种 不 同 的 方 


法 ， 在 第 二 类 办 法 中 有 m 2 种 不 同 的 方法 ， 以 此 类 推 ， 在 第 n 类 办 法 中 
有 mn 种 不 同 的 方法 ， 那 么 完成 这 件 事 一 共有 m1 +m2 +...+mn 种 不 同 
方法 。 因 此 ， 如 果 说 积 类 型 是 步 步 相关 的 话 ， 那 么 和 类 型 束 是 各 目 独 六 
Ho WARP RNG CRO, ABMS ee OT 
取 ) 。 

Rust 中 用 来 消除 空 指针 的 Option<T > 类 型 就 是 一 种 典型 的 枚 举 
体 ， 如 代码 清单 7-11 所 示 。 

代码 清单 7-11: Option<T > 是 一 种 典型 的 枚 举 体 


i! pub enum Option<T> 1 
Z None, 

Ss Some (T), 

4 } 


Option 二 TT 二 是 一 种 典型 的 和 类 型 ， 它 代表 有 和 无 之 和 ， 将 两 种 不 
同 的 类 型 构造 为 一 种 新 的 复合 类 型 。 枚 举 体 包 含 了 有 限 的 枚 举 值 ， 要 使 
用 它们 ， 必 须 逐 个 枚 举 其 中 每 一 个 值 。 和 结构 体 不 同 的 是 ， 枚 举 体 中 的 
成 员 是 值 ， 而 非 类 型 ， 一 般 把 它们 叫 作 变 体 (variant ) 。 使 用 枚 举 体 
可 以 更 方便 地 实现 多 态 。 

可 以 使 用 枚 举 体 方便 地 表示 闫 色 ， 如 代码 清单 7-12 所 示 。 

代码 清单 7-12: EHAR R KE 


1. enum Color í 


Z Red, 

9 a Yellow, 
4. Blue, 
Da } 


只 有 对 比 才 能 体现 出 枚 举 体 的 方便 之 处 ， 不 妨 考 虑 用 面 癌 对 象 语言 
该 如 何 实现 这 种 情况 ? 代码 清单 7-13 展 示 出 了 相关 仿 代 但 。 
代码 清单 7-13: HEY RIBS PRR ME ARIS RE 


il class Color, } 

yap class Red: Color{} 

eP class Yellow: Color{ } 
4. class Blue: Color{ } 


代码 清单 7-13 用 伪 代 码 展示 了 诸如 Ruby、Python、Java、C++ 之 关 
的 面 同 对 和 象 语言 会 如 何 表 示 雇 色 。 首 先 需 要 定义 一 个 Color 类 ， 也 需要 
为 具体 的 闫 色 定 义 相 应 的 类 ， 比 如 Red、Yellow 和 Blue 需 要 各 目 继 承 
Color 来 实现 相关 的 方法 。 而 在 Rust 中 ， 只 雷 要 枚 举 体 束 已 足够 。 

接 下 来 ， 我 们 使 用 枚 举 体 来 午 构 之 前 color.rs 中 实现 的 代码 ， 以 便 
可 以 方便 地 添加 新 的 磊 色 。 之 前 的 代码 主要 有 三 处 需要 变动 : 

使 用 枚 举 体 来 管理 类 色 ， 而 不 是 直接 在 其 体 的 方法 中 使 用 凑 色 代 
Aids 

使 用 模式 匹配 代 稚 计 来 确认 结构 体 中 的 fgcolor 和 bgcolor 的 设置 情 
Dlo 

AY Se pe AB AWE 

重 构 color.rs 代 码 

代码 清单 7-12 已 经 创建 了 枚 举 体 Color 来 管理 闫 色 ， 接 下 来 要 为 其 实 
现 一 些 方法 ， 用 于 将 Color 中 的 每 个 变 体 和 具体 的 ANSI 闫 色 人 码 对 应 起 
来 ， 如 代码 清单 7-14 所 示 。 

代码 清单 7-14: 为 Color 实 现 相 应 的 方法 ， 以 对 应 具体 的 ANSI 瑞 色 
位 


io Oa] OC WO) & G hk FE 


PRP RP PrP PrP PB 
oq ms WON H Oi 


Lo; 


iL Cl { 
in to tg str(ésell) -> wetr | 
match *self { 
COLGE? TREO => "S31"; 
Color: Yellow => "33", 
Color::Blue => "34", 


} 
if EO 5G SEESeELL) => ser | 
match “self { 
Colors:Red => "41", 
Color::Yellow => "43", 
Color:: Blue => "44", 


} 


代码 清早 7-14 通 过 impl 关 键 字 为 Color 实 现 了 两 个 方法 ，to_fg_str 和 和 
to_bg_str， 分 别 用 于 对 应 前 景色 和 背景 色 的 ANSI HME. TER, OH 
使 用 了 match 模式 匹配 ， 和 用 盖 了 Color 中 的 每 一 个 值 ， 这 是 必须 的 ， 否 
则 Rust 会 编译 错误 。 这 里 值得 注意 的 地 方 是 ， 代 人 码 第 3 行 和 第 10 行 中 的 
*self 并 不 会 获取 self 的 所 有 权 。 

下 一 步 要 修改 结构 体 ColoredString 中 fgcolor 和 bgcolor 字段 的 类 
型 ， 如 代码 清单 7-15 所 示 。 

代码 清单 7-15: 修改 ColoredSstring 结 构 体 中 fgcolor 和 bgcolor 的 类 


型 


#[derive(Clone, Debug, PartialEg, Eq) ] 
struct ColoredString { 
Tie: PELLG; 
LoCce lore Options Colore, 
bocoler: Oprren<Coler->, 
} 
impl Default for ColoredString 4 
fi geraulrt{) -> SELT { 
ColeredsString 4 


Oo 00 «dd G => GW NHN FF 


上 一 
Cc) o 


input: String: ederault {), 
Li fgcolor: None, 
LD ig bgcolor: None, 
133 } 
14. } 
Lie I 

代码 清单 7-15 将 fgcolor 和 bgcolor 字段 类 型 改 为 了 Option<Color 
之 。fgcolor 和 bgcolor 有 两 种 可 能 的 什 : 要 么 有 ， 要 么 无 。 因 此 ， 这 里 非 
第 适合 使 用 “Option< 工 > 类型 ， 驶 不 需要 再 使 用 is_empty 方 法 进行 判断 
了 。 既 然 结构 体 变 了， 那么 其 默认 值 也 需要 进行 相应 的 改变 ， 因 为 修改 
为 了 Option<Color 之 ， 所 以 fgcolor 和 bgcolor 的 默认 值 完全 可 以 统一 设置 
为 None。 

接 下 来 ， 需 要 为 Color 实 现 From， 用 于 将 &str 或 String 类 型 的 字符 串 
转换 为 Color， 这 样 做 是 为 了 实现 通过 字符 串 来 设置 闫 色 的 需求 ， 如 代 
但 清单 7-16 所 示 。 

代码 清单 7-16: 为 Color 实 现 From 


Oo ==] OF & A W NW FF 


rPrPrPrP FP FP © 
mB WH rR oO. 


16% 


Nm DN Ww Dw VU Pe Pe Fe 
OO = Go Y A © tO Go =) 


str: 


use stds !convert: i From; 

wee stds: stirs sf romstr: 

Wee Studs istrina: Sorr ry 

Tip ls a> Fronse’a stre Tor Color J 
fh LYromtsers: £852) -> Sele 4 


Src. parse) unwrap or(CoLor: : Red) 


} 
Lip. FROn<String> for Caller | 
Em Eromisnes String) ~> Sela { 


STCrsxParse (|) «Unwrap or(Color? eked) 


} 
imp. Fremsis fom Color 1 
type Err = (); 
La Crom SCE (SrO estr) -> BResulrxcell, sell 
Ler Sree = So. LO Lonercassej} 
match sre.as rerl) | 
"red" => Ok(Color::Red), 
"vellow" => Ok(Color::Yellow), 
"blue" => Ok(Color::Blue), 
ar 1) ) 


} 


| 


要 实现 From， 需 要 显 式 地 导入 std: : convert: : From., std: 
: FromStr 和 std: : string: : String 。 代 码 清单 7-16 的 第 4 行 到 


第 13 行 为 Color 实 现 了 可 以 从 &str 和 String 转 换 的 from 方 法 。 其 中 用 到 了 
parse 方法 ， 该 方法 要 求 目 标 类 型 必须 实现 FromStr ， 所 以 代码 第 14 行 
到 第 24 行 专门 为 Color 实 现 了 FromStr。 


器 一 个 Result< Self, Self: 


实现 FromStr 的 from_str 方法 包含 了 错误 处 理 相关 的 代码 ， 最 终 返 
: Err> 类 型 的 结果 。 谤 方法 主要 包含 两 个 


动作 ， 第 一 个 动作 是 使 用 标准 库 提 供 的 to_lowercase 方 法 将 传 入 的 字符 


串 变 为 小 号 ， 第 二 个 动作 是 使 用 match 死 配 可 能 的 值 ， 来 返回 相应 的 
Color 变 体 。 注 意 match 匹 配 使 用 了 通配符 来 下 配 可 能 值 之 外 的 全 部 情 
况 ， 这 里 返回 了 Er。 关 于 错误 处 理 更 详细 的 内 容 将 在 第 9 章 介 绍 。 

代码 第 6 行 和 第 11 行 的 parse 方 法 进行 类 型 转换 时 ， 使 用 了 unwrap_or 
方法 。parse 方 法 会 返回 Result 类 型 的 值 ， 如 果 是 Ok 二 T 二 类 型 ， 则 会 通 
过 unwrap 来 获取 其 中 的 值 ， 如 果 是 Err<T> 类 型 ， 则 返回 指定 的 默认 值 
Color: : Red。 看 得 出 来 ， 使 用 枚 举 体 可 以 非常 干净 安全 地 处 理 这 种 情 
le 

因为 增加 了 新 的 磊 色 ， 下 一 步 来 修改 Colorize 这 个 trait， 如 代码 清单 
7-17} TAS o 

ARS 7-17: 修改 Colorize 


ls tart Colerize { 

is fn red(self) -> ColoredString; 

5s fn yellow(self) -> ColoredString; 

d fn blue(self) -> ColoredString; 

ae ti calors: Inte<Color>>(selt, color: &) -> Coleredstring: 

Gin fn on red(self) -> ColoredString; 

Ta fn on yellow(selt) => Coloredstring; 

on fn on blue(self) -> ColoredString; 

9. fi Gn Colores: Inte<Coler>>(selt, color: 5) -> Coloredstring; 
We J 


除了 添加 了 新 的 颜色 设置 方法 ，Colorize 最 明显 的 变化 是 第 5 行 和 第 
9 行 分 别 深 加 了 color 方 法 和 on_color 汉 型 方法 。 使 用 这 两 个 方法 束 可 以 通 
EAE FE EB OR CS ZS ig SCAB AN EE 

9X fa, ColoredString#l&’ a str 分 别 实 现 Colorize 的 代码 也 需要 做 相 
应 的 修改 ， 如 代码 清单 7-18 所 示 。 

代码 清单 7-18: 修改 ColoredSstring 和 &'a str 实现 Colorize 的 相关 
代码 


Lla 


impl Colorize for ColoredString { 


fn 
fn 
fn 
fn 


fn 
fn 


} 


red(self) -> ColoredString {self.color(Color::Red) } 
yellow(self) -> ColoredString {self.color(Color::Yellow) } 
blue (self) -> ColoredString {self.color (Color: :Blue) } 
color<S: Into<Color>>(self, color: S) -> ColoredString 1 
ColoredString { fgcolor: Some(color.into()), ..self } 


on red(self) -> ColoredString {self.on color (Color: :Red) } 
on yellow(self) -> ColoredString { 


self.on color (Color: : Yellow) 


fn on blue(self) -> ColoredString {self.on color(Color::Blue) } 
fn on color<S: Into<Color>>(self, color: S$) -> ColoredString { 


ColoredString { bgcolor: Some(color.into()), ..self } 


impl<'a> Colorize for &'a str { 
fn red(self) -> ColoredString {self.color (Color: :Red) } 
fn yellow(self) -> ColoredString {self.color(Color::Yellow) } 
fn blue(self) -> ColoredString {self.color (Color: :Blue) } 
fn color<S: Into<Color>>(self, color: S) -> ColoredString i 


ColoredString { 


fgcolor: Some(color.into()), 
input: String::from(self), 
..ColoredString: : default () 


28. Fn on red(self) -> ColoredsString {selfoon color(Colors: Red) } 
29. rt on yellow(selt) => Coloredstring | 

aN i selt.on color (Color: Yellow) 

ks } 

I 4 Pn on plue (self) -> CeloredString {self on color (Color:<¢Blue) | 
33% rn on calors: Into<color>o(selt, color: 5) => Coleredstring « 
34. ColoredString { 

3a bgcolor: Some(color.into()), 

ahs inputs Strings srrom(selt), 

314 ..ColoredString::default () 

38 } 

a's } 

40. } 


在 代码 清单 7-18 中 ， 值 得 注意 的 是 ，color 和 on_color 汉 型 方法 中 
使 用 了 trait INE <S: Into<Color> >, XÆ Color Ei Y From, PF 
以 对 于 String 和 多” a str 类 型 的 字符 串 均 可 通过 into 方 法 转换 为 Color。 

最 后 一 个 需要 修改 变化 的 束 是 compute_style 方 法 ， 因 为 
ColoredString 结 构 体 中 字段 闫 型 都 变 了 了 ， 讽 方法 中 需要 将 计 判 新 修改 为 
模式 匹配 ， 如 代 但 清单 7-19 所 示 。 

代码 清单 7-19: 修改 compute_style 方 法 


impl ColoredString { 
fn compute style(é&self) -> Strang 1 
let mat res = Strings: ytront lB|L Ys 


if let Some(ref bgcolor) = self.bgcolor { 
Li has wrote { res.push(";") 2} 


1 

2 

3 

4. Jet Mt has wrote = lalse; 

5 

6 

7 res.push stribegcolor.to bo str); 
8 


has: wrote = Live? 
vi. } 
Ls if let Some(ref fgcolor) = self.fgcolor { 
Lis if has wrote ires.pusn("s*) sJ 
Le Eee «push Str (Tocelor.to to srry is 
LS } 
14. res.push('m'); 
las res 
LS } 
a d 


compute_style 方 法 的 基本 逻辑 并 未 改变 ， 只 是 将 if 改 为 了 if” ”let 模式 
玫 配 ， 最 终 的 main 孙 数 如 代码 清单 7-20 所 示 。 
代码 清单 7-20: main pK% 


ls fn Wa 1 

A let red = "red".red(); 

Bn printing ¢("{i", red); 

4. let yellow = “yellow” .yellow() .on blue () ; 
zM printlnt("{;", yellow) ; 

Biss let blue = "blue".blue(); 

Tá princlnl( "13", blue) iį 

Si. let red = "red".color ("red"); 

Be praintini Tt ned); 

10. let yellow = “vyellow".on color<¢"yel low") : 
Lig printlin! ("{}", yellow) ; 

Lee } 


MÆ BY WE AB aS EY FOR BCE A VES JEH a DAE 


color 和 on _color 方法 通过 字符 串 来 指定 斋 色 。 编 诺 并 运行 重 构 后 的 
color.rs， 将 成 功 输出 预期 的 结果 。 

通过 对 color.rs 进 行 午 构 ， 我 们 可 以 更 深刻 地 体会 到 枚 淮 体 的 方便 和 
强大 之 处 。 枚 淮 体 、 结 构 体 和 trait 相 互 结 合 ， 完 全 可 以 进行 面 同 对 象 风 
格 有 的 编程 ， 其 至 可 以 比 一 些 面 同 对 象 语言 更 简洁 更 优雅 。 更 重要 的 一 点 
是 ，Rust 是 零 成 本 抽象 的 。 


7.1.3 析 构 顺序 


通过 第 4 章 的 学 习 ， 我 们 已 经 知道 了 结构 体 和 枚 举 体 的 内 存 布局 ， 
但 是 结构 体 中 的 字段 是 如 何 析 构 的 呢 ? Rust 中 变量 的 析 构 顺序 是 和 其 声 
明 顺 序 相 反 的 ， 但 并 非 所 有 的 闫 型 都 按 这 个 顺序 来 析 构 。 接 下 来 我 们 用 
一 些 实验 示 例 来 说 明 其 中 的 规律 。 

自 完 使 用 Newtype 模 式 来 创建 一 个 元 组 结构 体 ， 让 其 实现 Drop， 如 
代码 清单 7-21 所 示 。 

代码 清单 7-21: 定义 元 组 结构 体 并 为 其 实现 Drop 

Le BEEFUEE PELNEDNEGDLEL EE SEEI} 


fa impl Drop for PrintDrop 4 

cP fn drop(&mut self) { 

4 printin! ("Dropping {}", selrt.0) 
Bis } 

hs } 


代码 清单 7-21 中 定义 的 结构 体 主要 用 于 测试 析 构 顺序 。 这 里 使 用 了 
Newtype 模 式 来 创建 结构 体 ， 实 际 上 是 用 元 组 结构 体 包 装 了 某 个 类 型 ， 
从 而 相当 于 创造 了 一 个 新 类 型 。Newtype 模 式 在 Rust 中 很 常见 。 

这 样 创建 的 狐 类 型 和 原始 的 类 型 是 完全 不 同 的 ， 以 下 几 种 情况 适合 
使 用 Newtype 模 式 : 

” 隐 基 实际 类 型 ， 限 制 功能 。 使 用 Newtype 人 模式 包 疙 的 类 型 并 不 能 
MID FL IH], RARER DTT YZ 

明确 语义 。 比 如 可 以 将 f64 类 型 包装 为 Miles (£64) 和 
Kilometers (f64) ， 分 别 代 表 严 里 和 干 术 。 这 样 的 语义 提升 是 零 成 本 
的 ， 没 有 多 余 的 性 能 开销 。 


使 复制 语义 的 类 型 具有 移动 语义 。 比 如 £64 本 来 是 复制 语义 ， 而 
包装 为 Miles (f64) 之 后 ， 因 为 结构 体 本 号 不 能 馈 目 动 实现 Copy， 所 以 
Miles (f64) 就 成 了 移动 语义 。 

代码 清单 7-21 使 用 Newtype 模 式 只 是 为 了 提升 语义 ， 增 强 可 读 性 ， 
方便 后 面 示例 代码 的 展示 。 

本 地 变量 

本 地 变量 过 人 循 完 声明 后 析 构 的 规则 ， 实 际 上 这 也 绿 于 栈 结 构 先进 后 
出 的 特性 ， 本 地 变量 的 析 构 如 代码 清单 7-22 所 示 。 

代码 清单 7-22: 本 地 变量 的 析 构 


Ls tn maini] 4 
Pie 16E * = PFIHEDFOD ("x") ; 
ce let y = PrintDrop("y"); 


4. 3} 
代码 清单 7-22 的 输出 结果 如 代 人 码 消 单 7-23 所 示 。 
代码 清单 7-23: 代码 清单 7-22 的 输出 结 
Dropping y 
Dropping x 
看 得 出 来 ， 先 声明 了 x， 但 是 先 析 构 的 是 y。 因 此 ， 改 变 放 置 顺序 
有 可 能 会 导致 总 垂 指针 。 同 样 道 理 ， 在 编写 Rust 代 码 时 ， 你 会 及 现 有 时 
只 要 修改 一 下 变量 声明 的 顺序 ， 本 来 无 法 编 详 的 代码 束 可 以 正常 编 详 通 
Ug 
元 组 
元 组 的 析 构 如 代码 清单 7-24 所 示 。 
代码 清单 7-24: 元 组 的 析 构 
fn main() { 
let tupli = (PrantDrop("a"), PrintDrop("b"), PrantDrep("e")) 3 
let top? = ({Princbrop ("x"), PrinctDrop("y"), PrintDrop ("z2"); 


= Co hd F 


代码 清单 7-24 编 译 执 行 的 结果 如 代码 清单 7-25 所 示 。 
代码 清单 7-25: 代码 清单 7-24 的 输出 结 


Dropping 
Dropping 
Dropping 
Dropping 
Dropping 


a o w mw He N 


Dropping 
AIER, TERARI EA a Re A AT AIA BL, TE 
JCH N ŠB JER HY Hr AUE A a Be E RI I TOA BE Te 
JOZ HI E UII RR TEE AT TPA YY o 
现在 把 元 组 tup2 ”中 最 后 一 个 元 系 修 改 为 一 个 特殊 的 元 系 panic! 
() ， 看 看 会 肥 生 什么 ， 如 代码 清单 7-26 所 示 。 
代 但 清单 7-26: 将 tup2 中 的 最 后 一 个 元 系 修 改 为 panic! O 


1. fn main() 1 

re let tupl = (PrantDrop("a™), PrintDrop("b"), PrantDrop("e") ); 
3 let tuo? = (PrintDropt"x"), PrintDrops ("vy"), panie! ())% 

4 } 


宏 panic! O 会 引起 main 线 程 朋 尝 ， 但 是 析 构 函数 还 是 会 输出 如 代 
但 清单 7-27 所 示 的 结果 。 
代码 清单 7-27: 代码 清早 7-26 的 输出 结果 


Dropping y 
Dropping 


— 


Dropping a 
Dropping b 
Dropping c 
AER, tup FERRIERE AR, MARIS 7-24 AT 
构 顺 序 正 好 相反 。 可 以 理解 为 ， 线 程 的 朋 尝 触 肥 了 tup2 的 提前 析 构 ， 
此 时 tup2 其 实 并 不 算 一 个 完整 的 元 组 ， 这 种 提前 析 构 的 顺序 正好 和 局 
部 变量 的 析 构 顺序 一 致 : 先 声明 的 元 素 后 析 构 。 
结构 体 和 枚 举 体 
结构 体 和 枚 举 体 与 元 组 的 析 构 顺序 是 一 致 的 ， 如 代码 清单 7-28 所 


一 和 


人 小 。 


代码 清单 7.28， 结 构 体 和 枚 举 体 的 析 构 顺 序 


1. enum Ef 

Ea Foo (PrintDrop, PrintDrop) 

Sy J 

4. struct Foot 

oi KS PZLOEDEOD, 

6. vr Perm 

Ts 23 Princurop, 

Ws d 

2 { 

10 let e = Ex: Foo (PrantDrop ("a"), PrintDrep("b")) 9 
ie let f = Foo{ 

l2; Si PEIHCOTODI" Z Jy Vi LD ("vy"), Zi EL DY 2m] 
Le. Fs 

14. } 
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代码 清单 7-29: 代码 清单 7-28 输 出 结果 
Dropping x 
Dropping y 
Dropping z 
Dropping a 
Dropping pb 
看 得 出 来 ， 结 构 体 实例 f 和 完 析 构 ， 枚 举 值 e 最 后 析 构 。 但 古 其 内 部 元 
系 的 析 构 顺序 是 投 排 列 顺序 来 术 构 的 。 同 样 ， 绪 构 体 字段 如 末 指 定 了 
panic! O 为 信 ， 那 么 在 相同 的 情况 下 ， 其 析 构 顺序 也 会 变 得 和 元 组 的 
一 致 。 
同 理 ，Slice 类 型 的 集合 类 型 的 析 构 顺序 ， 与 元 组 、 结 构 体 和 枚 举 体 
的 析 构 行为 一 致 。 
闭 包 捕获 变量 
闭 包 的 捕获 变量 的 析 构 顺序 和 结构 体 的 析 构 顺序 也 是 一 致 曲 ， 如 代 
人 码 清单 7-30 所 示 。 
代码 清单 7-30: 闭 包 捕获 变量 的 析 构 顺序 


fn main() { 
let z = PrintDrop("z"); 


1 
2 
re let x = PrintDrop ("x"); 
4 let y = PrintDrop("y"); 
5 


a let closure = move || { y; Z; x; }; 
Shas } 
代码 清单 7-30 的 运行 结束 如 代码 清单 7-31 所 示 。 
代码 清单 7-31: 代码 清单 7-30 的 输出 结果 
Dropping y 
Dropping z 
Dropping x 


看 得 出 来 ， 财 包 捕 获 变 量 的 析 构 顺序 和 闭 包 内 该 变量 的 排列 顺序 一 
致 ， 与 捕获 变量 声明 的 顺序 是 没有 关系 的 ， 这 里 要 和 普通 函数 内 局 部 变 
量 相 区 分 。 但 财 包 和 元 组 、 结 构 体 闫 似 ， 也 存在 析 构 顺序 变化 的 情况 ， 
如 代码 清单 7-32 所 示 。 

代码 清单 7-32: 闭 包 捕获 变量 析 构 顺序 变化 的 特殊 情况 


Le En marng { 

2 let y = PrintDrop("y"); 
Sa let x = PrintDroep ("x") ; 
4. let z = PrintDrop("z"); 
Bia let closure = move || { 
Ga | det z rer = zi } 
Ta X; Vr Z? 

8. be 

Be }] 


代码 清 蛙 7-32 中 的 团 包 使 用 了 一 个 内 部 作用 域 来 引用 变量 z， 这 次 
编译 的 结果 如 代码 清单 7-33 所 示 。 
代码 清单 7-33: 代码 清单 7-32 的 输出 结 末 
Dropping Zz 
Dropping x 
Dropping y 
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闭 包 之 前 先 被 借用 了 ， 所 以 需要 等 每 其 离开 作用 域 归还 所 有 权 之 后 ， 才 
能 被 move 到 闭 包 中 。 因 此 ， 变 量 被 捕获 的 顺序 就 变 成 了 z > X > y， 然 
后 按 此 有 顺序 再 进行 析 构 。 


7.2 第 用 设计 模式 


有 了 trait、 结 构 体 和 枚 举 体 这 三 要 马车 ， 我 们 束 可 以 目 由 地 编号 容 
易 扩 展 的 Rust 代 码 了 。 它 们 简单 、 灵 活 和 方便 ， 也 正 因 为 如 此 ， 才 更 需 
要 使 用 设计 模式 来 帮助 我 们 设计 出 更 灵活 、 更 简洁 、 更 易 扩 展 和 更 好 维 
护 的 系统 。 

目 GoF 四 人 组 提出 23 种 设计 模式 的 概念 至 今 已 经 超过 20 年 了 ， 虽 然 
设计 模式 最 初 是 基于 面 问 对 象 语言 提出 的 ， 但 是 经 过 这 20 多 年 的 发 


展 ， 设 计 模 式 已 经 超越 了 面 癌 对象 语 言 的 范畴 。 设 计 模 式 所 前 述 的 思想 
被 广泛 应 用 于 各 种 语言 及 其 工程 项 目 中 。 设 计 模 式 的 思想 一 共 涵 兽 了 下 
面 4 点 : 

` 针对 接口 编程 。 

组合 优 于 继承 。 

: 分 离 变 和 不 变 。 

` 委托 代 符 继承。 


可 以 说 ，Rnust 语 言 本 喘 的 设计 吏 非 党 符合 这 4 点 思想 。trait 可 以 强制 
性 地 实现 针对 接口 编程 ， 泛 型 和 trait 限 定 可 蔡 代 继承 实现 多 态 ， 基 于 代 
数 数 据 类 型 的 结构 体 或 枚 举 体 在 没有 继承 的 情况 下 也 一 样 可 以 更 目 由 地 
构造 各 种 类 型 ， 类 型 系统 天 生 分 离 了 变 与 不 变 ; HANIA aS a eA 
委托 来 代 答 继承 的 。 

Rust 是 一 门 已 经 实现 目 举 的 语言 ， 其 内 部 实现 也 用 到 了 很 多 设计 模 
式 。 比 如 第 6 章 学 到 的 运 代 需 束 包含 了 委托 模式 和 从 代 需 模 式 的 思想 。 
在 Rust 的 其 他 诸多 项 目 中 也 大 量 使 用 了 设计 模式 。 接 下 来 会 依次 介绍 
Rust 编 程 中 常用 的 男 外 几 个 设计 模式 。 

7.2.1 建造 者 模式 

Rust 这 | 语 言 没有 提供 构造 疯 数 ， 这 主要 是 出 于 对 类 型 安全 有 的 考 
量 。 我 们 以 一 个 结构 体 为 例 来 说 明 ， 如 果 要 构造 结构 体 的 实例 ， 有 了 时候 


南 要 一 些 款 认 值 ， 像 Java 这 种 语言 会 捉 供 默认 的 构造 函数 ， 并 可 以 将 但 
倪 始 化 为 0， 而 对 于 C++ 来 说 ， 束 有 可 能 引起 未 定义 行为 ， 这 属于 类 型 


不 安全 的 问题 。Rust 并 没有 类 似 Java 那 样 的 默认 机 制 ， 所 以 Rust 没 有 提 
PERE RRA, AG AY DAR eR SU Se AN PE eB RE EK Pee SS YS 
所 以 ， 束 需要 一 些 设计 模式 来 辅助 完成 复 洒 类 型 实例 的 构造 工作 ， 而 建 
造 者 檬 式 比较 适合 这 种 应 用 场景 ， 这 也 是 Rust 中 大 量 使 用 这 种 模式 的 原 
A] 。 

建造 者 模式 (Builder Pattern ) 是 Rust 中 最 利用 的 设计 模式 之 一 。 
建造 者 模式 是 指使 用 多 个 简单 的 对 象 一 步 步 构建 一 个 复杂 对 象 的 模式 。 
该 模式 的 主要 思想 融 是 将 这 和 不 变 分 离 。 对 于 一 个 复杂 的 对 象 ， 肯 定 会 
有 不 变 的 部 分 ， 也 有 变化 的 部 分 ， 将 它们 分 离开 ， 然 后 依次 构建 ， 如 代 
人 码 清单 7-34 所 示 。 

代码 清单 7-34: 建造 者 模式 示例 


Oo wl Oh GF te tw bo FF 


SEDEC CIGIS { 
xo T64, 
y: £64, 
radius: fog; 
} 
struct CarcleBuilder { 
x: fody 
ve fody 
radius: £064, 
} 
impl Circle { 
fn area(&self) -> £64 { 
Stat et od et ter * 
} 
fn new() -> CircleBuilder { 


CircleBuilder { 


(self.radius * self.radius) 


mi Uoo vi 0.0, maar: 


} 
impl CircleBuilder { 
fn x(&mut self, coordinate: 
self.x = coordinate; 
self 
} 
fn y(&émut self, coordinate: 


self.y = coordinate; 


£04) 


£64) 


kell 


-> &mut CircleBuilder { 


-> &mut CircleBuilder { 


28. self 


Ps y } 

30 fn radius(&mut self, radius: f64) -> &mut CircleBuilder 1 
ALs self.radius = radius; 

32. self 

BS « } 

34. tn build(éselt) => Circle 4 

Tia Circle { 

30. x: Sol Vi Selt.y, radius: Self. radins, 
Bits } 

38 » } 

39... } 

40. £n. Main() 4 

41. let c = Circle: :new() 

42. etil, 0) yia) «radius (2.0) 

ce » BULL 

44. assert, eq. (C.aKee (), 12.0605 UELLSIT] 

45. assert eq: (c.x, 1.0); 

46. assert SG. (6K¥, sU)? 

47. } 
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由 地 通过 指定 的 方法 创建 一 个 圆 ， 并 可 访问 其 面积 和 坐标 。 

代码 第 1 行 到 第 5 行 定义 了 结构 体 Circle， 包 仿 x、y 和 radius 三 个 字 
段 ， 分 别 代 表 横 纵 坐 标 和 半径 。 

代码 第 6 行 到 第 10 行 定义 了 结构 体 CircleBuilder， 包 含 的 字段 和 
Circle 结 构 体 的 一 样 。 这 里 实际 上 还 是 利用 了 委托 的 思想 ，Cirdle 委 托 了 
CircleBuilder 来 帮助 构建 其 实例 。 

代码 第 11 行 到 第 20 行 为 结构 体 实 现 了 求 面 积 的 area 和 new 方 法 。area 
方法 中 用 到 的 std: : f64: : consts: : PI 是 由 标准 库 提 供 的 数学 第 量 圆 
H m 。 而 new 方 法 返回 的 是 CircleBuilder 实 例 。 

代码 第 21 行 到 第 39 行 为 CircleBuilder 实 现 了 一 系列 方法 。 首 先是 X、 
y 和 radius 方 法 ， 分 别 用 于 修改 CircleBuilder 实 例 中 相关 字段 的 值 ， 并 在 
修改 完 之 后 返回 目 坊 的 可 变 借 用 。 最 后 是 build 方 法 ， 它 根据 


CircleBuilder 的 实例 构建 最 终 的 Circle 实 例 并 将 其 返回 。 

经 过 这 样 精心 的 构造 ， 残 可 以 在 “main 上 国 数 中 使 用 Circle: : 
new (©) .x (1.0) .y (2.0) .radius (2.0) .build ©) 这 样 优雅 的 链 式 调 
用 来 创建 Circle 的 实例 了 。 

在 Rust 标 准 库 中 有 一 个 用 于 创建 进程 的 结构 体 std: : process: : 
Command， 它 使 用 了 创建 者 模式 ， 代 人 码 清 香 7-35 展 示 了 其 用 法 。 

代码 清单 7-35: std: : process: : Command 使 用 示例 


ls USE St? :DroOocess: :Command; 


2 fn main() { 

3 Command: :new("1s") 

4. kg tL” } 

5 arg ("=") 

6 . Spawn () 

7 ¿expect ("ls command failed to start"); 


Ba } 
看 得 出 来 ， 代 码 清 单 7-35 中 的 Commad 使 用 示例 和 代码 清单 7-34 中 
创建 的 Circle 实 例 的 用 法 非常 相似 。 


7.2.2 访问 者 模式 


Rust 中 男 一 个 香 要 有 的 模式 是 访问 者 模式 (Visitor Pattern ) 。 访 问 
者 模式 用 于 将 数据 结构 和 作用 于 结构 上 的 操作 解 炸 。Rust 语 言 自 壬 在 解 
析 抽 象 语法 树 时 就 用 到 了 访问 者 模式 。 

Rust 编 译 占 源码 中 有 的 访问 者 模式 

Rnust 解 析 抽 象 语 法 树 如 代码 清单 7-36 所 示 。 

代码 清单 7-36: Rust 解 术 抽 象 语法 树 示 章 


i mod ast { 

2 pub enum Stmt { 

3 Expr (Expr) ; 

4. Let (Name, Expr), 

Ss } 

6 pub struct Name { 

Į value: String, 

8 } 

9. pub enum Expr { 

10. IntEILE (IGT); 

il Add (Box<Expr>, Box<Expr>), 

12 is Sub (BOox<Expr>, BOx<Expr>) ; 

1: pA } 

Ie 

Se Wed visit 4 

Lọ, Use BStis*; 

6 bee PUD Evatt. VLSLEer<T> 1 

Le fn visit name (tmut self, nm: &Name) -> T; 
L9, fr Visit stmt (smut self, st stmt) => Ty; 
2s fri visit expr (smut self; Bs SExpr) -> T} 
2 、 } 

BZ x | 


代码 清单 7-36 只 是 展示 了 部 分 相关 代码 。 这 上段 代码 是 用 于 构建 抽象 
语法 树 的 ，Rust 语 法 中 包含 语句 、 标 识 和 从 名 称 和 表达 式 ， 分 别 补 定义 于 
ast ”模块 中 的 Stmt、Name 和 Expr 来 表示 。 关 键 字 mod 用 于 定义 一 个 模 
块 ， 在 第 10 章 会 介绍 更 多 关于 模块 的 内 容 。 

这 些 包谷 在 ast 模块 中 的 类 型 虽然 各 不 相同 ， 但 是 它们 整体 是 在 摘 
述 同 一 个 抽象 语法 树 结构 的 。 因 此 ， 整 个 抽象 语法 树 束 是 一 个 异 构 的 结 
构 ， 其 中 的 每 个 语法 市 态 都 古 不 同 的 类 型 ， 对 于 这 些 市 点 的 操作 也 各 不 
相同 。 语 法 贡 点 是 基本 确定 好 的 ， 变 化 不 会 太 大 ， 但 是 对 节点 的 操作 需 
要 经 第 改动 ， 比 如 Rust 现 在 正 处 于 有 展期 ， 会 定时 这 加 一 些 新 特性 。 使 
用 访问 者 模式 将 不 变 的 节点 和 变化 的 操作 分 离开 ， 可 以 方便 后 续 扩 展 。 
BRU, Di ae RR -REENA : 


` 定义 需要 操作 的 元 又。 

:定义 相关 的 操作 。 

对 于 代码 清单 7-36 来 说 ，ast 模块 定义 了 抽象 语法 树 中 的 全 部 太 点 
相关 的 数据 结构 ， 而 visit 模 块 中 的 Visitor ”trait 则 定义 了 相关 的 操作 。 所 
以 在 解析 语法 树 的 时 候 ， 只 需要 为 解析 豆 实 现 相 关 的 visit 方 法 即 可 操作 
相关 节点 ， 如 代码 清单 7-37 所 示 。 

代码 清单 7-37: RENTAS SET Visitor 


Le USE VISITI em 

2. Use astr: 

3. struct Interpreter; 

4. impl Visitor<i6o4> for Interpreter { 

oie fn visit name(&mut self, ni &Name) -> 164 { panic!() } 
0. fn visit stmt (Smut self, s: &Stmt) -> 164 i 

Ta maten 38s { 

8. Stmnt :SExpr (ref e) => sell sVisit expr (èë); 

9. Stmt::Let(..) => unimplemented! (), 

LD y } 

LL; } 

12s fl Visit Expr (emut self, BY eBxpr) -> 164 { 

DA a match *e { 

kla Expr ss Lanta (ny = ih 

EP Expr:tAdat(rer lhs, ref rns) => 

LS% selt Visit exgpr (lhs) + sell VLSI expr (rhs), 
Be A Expr::Sub(ref LAS, ref rhs) => 

Le self-visit expr(ihs) = seli.visit expr (rhs) , 
Ley } 

20. } 

2 P 


代码 清 蛙 7-37 为 解析 右 Interpreter 实 现 了 Visitor， 对 不 同 的 语法 树 市 
点 有 不 同 的 操作 方法 。 访 问 者 模式 优雅 地 把 市 点 数据 结构 与 其 解析 操作 
分 离开 了 ， 为 后 续 日 由 灵活 地 解析 语法 节点 提供 了 方便 。 

Serde 库 中 的 访问 者 模式 


访问 者 模式 的 另 一 个 经 典 的 应 用 场景 是 第 三 方 库 Serde ， 它 是 一 个 
对 Rust 数 据 结构 进行 序列 化 和 反 序 列 化 的 高 效 框 名 。Serde Man Wize 
分 别 从 Serialize (序列 化 ) 和 Deserialize 〈 反 序列 化 ) 两 个 单词 中 拿 
出 Ser 和 De 两 部 分 组 合 而 成 的 。Serde 之 所 以 称 为 框架 ， 是 因为 其 定义 
了 统一 的 数据 模型 ， 并 通过 访问 者 模式 开放 了 序列 化 和 反 序 列 化 的 操作 
接口 。Serde 目 前 已 经 文 持 了 很 多 数据 格式 ， 包 括 JSON、XML、 
BinCode、YAML、MessagePack、TOML 等 。 

Serde 中 序列 化 和 有 反 友 列 化 都 使 用 了 访问 者 模式 ， 这 里 只 以 反 友 列 
化 为 例 说 明 。Serde 中 目 定 义 了 一 些 类 型 来 对 应 Rust 中 可 能 出 现 的 所 有 
数据 类 型 ， 包 括 基本 的 原生 类 型 、String、option、unit、seq、tuple、 
tuple_struct、map、 struct 和 等。 比如，option 代 表 Option 二 TT 过 类 型 ， 
tuple_struct 代 表 元 组 结构 体 ，seq 代 表 线 性 序列 ( 像 Vec 二 T 二 之 类 的 集 
合 ) , mmap lA Kk-v tir (kk ůHHashMap<k, v>) . KER 
构 的 类 型 构成 了 Serde 框 架 的 统一 的 数据 模型 。 

接 下 来 ，Serde 提 供 了 三 个 trait， 如 代码 清单 7-38 所 示 。 

代码 清单 7-38: Serde 中 的 trait 示 意 
1. pub trait Deserialize<'de>: Sized { 

A fn deserialize<D>(deserializer: D) -> Result<Self, D::Error> 


ce where D: Deserializer<'de>; 


pub trait Deserializer<'de>: Sized { 


fn deserialize any<v>(selft, Visiter: V) 


4 

5 

Bi type Error: Error; 
7 

8 -> Result<V::Value, Self::Error> where V: Visitor<'de>; 
9 


fn deserialize str<V>(self, visitor: V) 


LU, -> Result<V::Value, Self::Error> where V: Visitor<'de>; 
LL 3 

了 

bs pub trait Visitors "der Bized i 

14. type Value; 

Lag fn V1ISit bopl<E> (Self; vw: bool) -> Result<SelT? Value, E> 
L where E: Error, 

Lids { 

LS krr(Errori:invalid type (Unexpected: :Bool(v), &self)) 
13. } 

20 ffi Visit Strsk>(self, vi SSE) -> Result<Self::Value, E> 
Bia where E: Error, 

Le a { 

te ETY (Error: invalid type (Unexpected: Str (y); s&selt)) 
24. } 

25 a 

26y |} 


代码 清单 7-38 中 展示 了 部 分 反 序 列 化 相关 的 trait。 通 过 Deserializer 
和 Visitor 两 个 trait 定 义 了 反 序 列 化 开放 的 操作 接口 。 这 残 是 Serde 框架 利 
用 访问 者 模式 所 定义 的 主要 内 容 : 统一 的 数据 模型 和 开放 的 操作 接口 
。 然 后 再 针对 不 同 的 数据 格式 实现 不 同 的 访问 者 操作 方法 。 

下 面 以 JSON 格 却 数据 反 序 列 化 为 例 来 说 明 。 第 三 方 库 serde_json 是 
基于 Serde 实 现 的 JSON 解 析 库 ， 访 库 将 JSON 和 格式 中 出 现 的 数据 闫 型 红 一 
定义 为 一 个 Value 枚 举 体 ， 如 代码 清单 7-39 所 示 。 

代码 清单 7-39:，serde_json 库 中 定义 Value 枚 举 体 示 意 


1 # [derive (Debug, Clone, PartialEgq) ] 
2 pub enum Value { 

3 Null, 

4 BOOL(DOOL) + 

oo Number (Number), 

6 String (Serine) y 

7 Array (Vec<Value>), 

8 Object (Map<String, Value>), 

9. } 

Mais 47-39 E Vaut & y opt MCAS (A, ZEAE iit: [ISON 
数据 格式 中 所 出 现 的 所 有 数据 类 型 。 所 谓 反 序列 化 ， 就 是 将 JSON 格 式 
的 字符 串 解析 为 Rust 数 据 类 型 。 接 下 来 ，serde_json 实 现 了 Serde 框 染 开 
放 的 trait 接 口 Deserialize、Vistitor 和 Deserializer， 人 代码 清单 7-40 展 示 了 
其 中 的 Visitor 和 Deserializer 的 实现 。 

代码 清单 7-40: serde_json 实 现 Visitor 和 Deserializer 代 码 示 意 
1. impl<'de> Deserialize<'de> for Value { 


A fn deserialize<D>(deserializer: D) -> Result<Value, D::Error> 


3 where D: serde::Deserializer<'de>, 

4 { 

Sa struct ValueVisitor; 

6 impl<'de> Visitor<'de> for ValueVisitor { 

7 type Value = Value; 

Bis fn visit bool<E>(self, value: bool) -> Result<Value, E> | 
Ya Ok (Value: :Bool (value) ) 

Lf) } 

tas 

LZ. } 

IEP deserializer.deserialize any (ValueVisitor) ; 

14. } 

LD: | 

16. impl<'de> serde::Deserializer<'de> for Value { 

lfa type Error = Error; 

18. fn deserialize any<V> (self; visitor: V) 

19. -> Result<V::Value, Error> where V: Visitor<'de>, 
20. { 

oly match self { 

22 Value: Nil => visitor.visit unit (), 

23. Value::Bool(v) => visitor.visit bool (g), 

24. Values :Number (n) => n.deserialize any (visitor), 
HP Values; String(vy) => visitor:visit string (v); 
26. Value: :Array(v) => {visitor.visit seq(...)}, 
21. Value: Object (y) => { visitor.visit, map(...)} 
Z8 。 } 

2 } 

Sus d 
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serde_json 实 现 了 Deserialize， 其 中 定义 的 deserialize 方法 正 是 最 终 用 于 
有 反 序 列 化 的 方法 。 在 deserialize 方法 中 定义 了 结构 体 ValueVisitor， 并 为 
其 实现 了 Visitor， 这 是 一 种 委托 模式 。 

serde_json 也 为 Value 实现 了 serde: : Deserializer， 其 中 


deserialize_any 方 法 是 专门 用 于 目 定 义 类 型 反 序 列 化 的 ， 比 如 Value 类 
型 。 通 过 一 个 match 匹 配 枚 举 体 Value 中 定义 的 6 种 类 型 ， 分 别 调用 了 相 
应 的 visit_ XXX 系列 方法 。 

以 上 束 是 Serde 框架 中 对 访问 着 模式 的 应 用 说 明 ， 看 得 出 来 ， 访 问 
者 模式 将 数据 结构 和 操作 分 离开 ， 为 代码 的 扩展 提供 了 极 大 的 便利 。 读 
者 也 可 以 三 看 本 书 配套 源码 中 包含 的 男 一 个 目 定 义 访问 者 模式 有 宁 例 。 


7.2.3 RAII 模 式 


Rust 的 一 大 特色 束 古 利用 RAU 进行 资源 管理 ， 让 我 们 能 够 编写 更 
安全 的 代码 。 接 下 来 以 一 个 示例 来 说 明 RAII 模 式 ， 如 代码 清单 7-41 所 
不 。 

代码 清单 7-41: RAII 模 式 示例 
1. #[derive(Clone) ] 
pub struct Letter { 


2 
Sw text. Serine, 
4 } 


pub struct Envelope { 
letter: Option<Letter>, 

} 

pub struct PickupLorryHandle { 
done: bool, 

} 

impl Letter { 


pub fn new(text: String) -> Self { 


Letter {text: text} 


} 
impl Envelope { 
pub fn wrap(é&mut self, letter: 


&Letter) { 


self.letter = Some(letter.clone()); 


} 

pub fn buy prestamped envelope () 
Envelope {letter: None} 

} 

impl PickupLorryHandle { 


-> Envelope { 


pub fn pickup(&mut self, envelope: &Envelope) { 


/*give letter*/ 
} 
pub fn done(&mut self) { 


self.done = true; 
printin! ("sent"); 
} 
} 
pub fn order pickup() -> PickupLorryHandle { 


PickupLorryHandle {done: false 
} 


fn main() { 


let letter = Letter: :new(String::from("Dear RustFest")); 


, /* other handles */} 


let mut envelope = buy prestamped envelope (); 


envelope.wrap(&letter) ; 


let mut lorry = order pickup (); 


lorry.pickup (&envelope) ; 
lorry.done(); 


代码 清单 7-41 展 示 的 是 一 个 送信 的 逻辑 。 代 人 码 第 1 行 到 第 4 行 定 义 了 
结构 体 Letter， 代 表 信 件 。 代 人 码 第 5 行 到 第 7 行 定义 了 结构 体 Envelope， 代 
表 人 信封， 其 中 字段 为 Option 二 Letter 二 > 类型， 代表 信封 里 有 信和 或 无 信 了 两 种 
状态 。 代 人 码 第 8 行 到 第 10 行 定 义 了 结构 体 PickupLorryHandle， 表 示 信 
件 被 装 车 送 走 ， 包 含 bool 类 型 字段 ，done 表示 其 状态 。 代 码 第 11 行 到 
第 20 行 分 别 为 Letter 和 Envelope 实 现 fnew (51418) 和 wrap (E) 两 个 
paneer 

第 21 行 到 第 23 行 定义 了 函数 buy_prestamped_envelope， 其 返回 一 人 
letter 侯 设置 为 None 的 Envelope 实 例 ， 表 示 购 买 市 邮 稚 的 空 信封 。 

第 24 行 到 第 32 行 为 PickupLorryHandle 实 现 pickup 〈 装 车 ) 和 
done (471K) 两 个 方法 。 第 33 行 到 第 35 行 实现 了 order_pickup 函 数 ， 表 
AKER IN MERER BP IK 

整个 逻辑 过 程 如 图 7-3 所 示 。 


Letternew 


wrap 


buy envelope 一 | order pickup | 
一 > 一 > 





图 7-3: 代码 清单 7-41 逻 辑 示 意图 
最 后 ，main 岗 数 如 代码 清早 7-42 所 示 。 
代码 清单 7-42:，， 4H X main pK Av 


fn main() { 
let letter = Letter::new(String::from("Dear RustFest")); 


let mut envelope = buy prestamped envelope) ; 


let mut lorry = order pickup (); 
lorry.pickup (&envelope) ; 


1 
2 
3 
4. envelope.wrap(é&letter) ; 
S 
6 
7 lorry.done(); 

8 


} 
BAERS, ERRATA Sle, (EPH, BEE 
以 下 问题 : 
Letter 有 可 能 人 饭 复 制 多 份 并 被 改 到 多 个 信封 (envelope) 里 ， 不 安 
ane 
信封 里 可 能 有 信 ， 也 可 能 没有 信 ; 或 者 同一 个 信封 可 能 朔 多 封 不 
辣 的 信件 ， 不 安全 。 
“无 法 保证 一 定 把 信 交 给 邮 年 了 ; 个 安全 
为 了 修正 这 三 个 问题 ， 可 以 使 用 RAII ARERI 7-41。 
香 构 后 的 代码 如 代码 清单 7-43 所 示 。 
代码 清单 7-43: 利用 RAII 模 式 重 构 代 码 清单 7-41 


Oo wd OG fh E G kh Fr 


WO 


pub struct Letter { 

texts Sprang, 
} 
pub struct EmptyEnvelope {} 
pub struct ClosedEnvelope { letter: Letter } 
pub struct PickupLorryHandle { done: bool } 
impl Letter { 

pub fn new(text: String) -> Self { 

Letter {text: text} 


} 
impl EmptyEnvelope { 
pub fn wrap(self, letter: Letter) -> ClosedEnvelope { 
ClosedEnvelope {letter: letter} 


17. pub fn buy prestamped envelope() -> EmptyEnvelope { 


LS 、 EmptyEnvelope {} 

lee d 

20. impl PickupLorryHandle { 

Sk pub fn pickup(&mut self, envelope: ClosedEnvelope) { 
2 ， /*give letter*/ 

23% } 

24. pub fn done(self) {} 

aBa | 

26. impl Drop for PickupLorryHandle { 

Ria fn drop (smut self) { println! ("Sent"); | 

28. } 

429. pub in order pickup() -> PickupLorryHandle 1 

SU s PickupLorryHandle {done: false , /* other handles */} 
Sly J 

32. fn main() { 

23 。 let letter = Letter::new(String::from("Dear RustFest")); 
34. let envelope = buy prestamped envelope (); 

35 « lec closed envelope = envelope.wrap letter]? 

30. let mur lorry = order’ pickup () 5 

Six Lorry .pickup (closed. envelope) ; 

3380 | 


代码 清单 7-43 中 为 了 解决 前 两 个 问题 ， 将 Envelope 结构 体 变 为 了 
EmptyEnvelope 和 ClosedEnvelope 两 个 结构 体 ， 分 别 代 表 衬 信封 和 已 装 
好 信件 的 信封 。 并 且 为 EmptyEnvelope 实 现 了 wrap 方法 ， 确 保 信件 被 放 
到 空 信 封 中 。 将 letter 用 于 实例 化 ClosedEnvelope， 并 且 转 移 了 letter 所 有 
权 ， 保 证 信件 只 封装 一 次 。 在 ”buy_prestamped_envelope 方法 中 使 用 
EmptyEnvelope， 傅 你 购买 的 是 空 信 封 。 

PickupLorryHandle 实 现 的 pickup 方 法 中 的 第 二 个 参数 envelope 被 设 
置 为 ClosedEnvelope 类 型 ， 确 你 装 车 的 信件 不 古 空 信 封 。 最 军 要 的 一 步 
是 ， 为 PickupLorryHandle 实 现 了 Drop， 使 用 drop 方 法 蔡 代 了 原来 的 done 

代 人 码 清 单 7-44 展 示 了 main 函 数 的 变化 : 


代码 清单 7-44: 重 构 main 函 数 
fh maini) 
2 let letter = Letter: :new(String::from("Dear RustFest") ); 
3 let envelope = buy prestamped envelope (); 
4. Let Closed envelope = eiveélope..wrap (letter) 7 
a let mut. lorry = order pickup () ; 
6 lorry.pickup (closed. envelope); 
{ } 

代码 清单 7-44 运 行 之 后 ， 会 输出 sent， 这 证 明 PickupLorryHandle 的 
实例 lorry 在 main 函 数 结束 之 后 运行 了 drop 方 法 ， 这 正 是 RAII 的 体现 ， 不 
仅 释 放 了 资源 ， 也 在 逻辑 上 保证 了 信件 已 经 安全 送出 。 

所 以 ， 所 谓 RAI 模 式 ， 并 非 经 典 的 GoF 中 的 模式 ， 它 实际 上 就 是 利 
用 Rust 的 RAII 机 制 来 确保 逻辑 安全 性 的 一 种 模式 。 这 种 模式 在 某 些 场景 
中 非常 适用 ， 比 如 处 理 HTTP 请 求 的 场景 。 它 也 是 Rust 官 方 团队 推荐 使 
用 的 模式 。 


7.3 /\\Z5 


本 和 章 从 结构 体 和 枚 举 体 的 角度 详细 介绍 了 Rust 语 言 如 何 结构 化 编 
程 。Rust 属 于 混合 范 陈 语言 AH trait、 结 构 体 和 枚 淮 体 可 以 完全 文 持 
面 回 对 象 风 格 的 编程 。 但 是 需要 注意 的 是 ，Rust 基 于 代数 数据 类 型 统一 
了 结构 体 和 枚 举 体 ， 当 进行 面 癌 对象 风格 的 编程 时 ， 不 要 以 传统 面 同 对 
象 语言 的 思路 去 写 程 序 ， 而 应 该 过 循 Rust 语 言 上 自重 的 特性 。 

Rust 语 言 的 哲学 是 组 合 优 于 继承 ， 结 构 体 和 枚 举 体 束 像 真实 建筑 中 
用 到 的 桦 咱 ， 可 以 上 自由 组 合 出 想 要 的 结构 。 在 日 常 的 编程 中 ， 使 用 设计 
模式 可 以 更 好 地 复 用 代码 ， 写 出 易 扩 展 、 吻 维护 的 程序 。 本 章 介绍 了 二 
种 党 用 的 设计 模式 : 创建 者 模式 、 访 问 者 模式 和 RAU 模式 ， 这 三 种 模 
式 在 Rust 内 部 及 第 三 方 库 中 都 被 大 量 应 用 。 除 了 这 三 种 模式 ， 还 有 其 他 
的 设计 模式 ， 比 如 观察 者 模式 、 稼 略 模式 等 ， 这 些 留 给 谈 者 目 己 去 学 习 
和 探索 。 

但 是 要 注意 ， 直 接 将 面 同 对 象 设 计 中 的 设计 模式 应 用 在 Rust 中 是 不 
Z, MZA a Rustif SROKA. SAI IE, E 
RustConf ” 2018 大 会 的 闭幕 演讲 ”口中 ， 演 讲 者 提 到 了 一 种 面向 数据 
(Data-Oriented) Witt, EAE TART Ee aw. Tat 
中 所 到 了 使 用 Rust 进 行 面 癌 数 据 设 计 来 实现 ECS 架 构 的 游戏 引擎 ， 同 时 
提出 了 三 种 模式 : DARRAI) (Generational Index) 模式 、 动 态 类 型 
(AnyMap ) 模式 、 注 册 表 (Register) 模式 ， 读 者 可 以 目 行 查看 。 





[1] RustConf 2018 闭 大 演讲 中 文 梳理 稳 参 见 https: //zhuanlan.zhihu.com/p/44657202. 


第 8 章 PAT EB Sta Re 


阵 而 后 战 ， 兵 法 之 第 ， 运 用 之 妙 ， 存 平一 心 。 

曾经 有 一 个 人 因为 说 了 一 句 话 而 获得 图 姑 奖 ， 这 个 人 束 是 Pascal 语 
言 之 父 尼 上 十 拉 斯 (Nicklaus Wirth〉， 他 说 的 那 句 话 是 : 程序 等 于 数据 结 
构 加 算法 。 因 为 一 句 话 而 获得 图 灵光 ， 这 当然 是 开 玩 突 ， 得 奖 完 全 得 益 
于 他 创造 的 Pascal 语 言 所 做 出 的 贡献 ， 他 也 与 了 一 本 以 那 句 话 为 书 名 的 
计算 机 专车。 但 这 足以 说 明了 数据 结构 的 重要 性 。 

数据 结构 是 计算 机 存储 和 组 织 数据 的 方式 。 对 于 不 同 的 场景 ， 精 心 
选择 的 数据 结构 可 以 市 来 更 高 的 运行 效率 或 存储 效 雍 。 通 音 ， 通 过 确定 
数据 结构 来 选择 相应 的 算法 ， 也 可 能 通过 算法 来 选择 数 气 结构， 不 管 是 
哪 种 情况 ， 选 择 合适 的 数据 结构 都 相当 重要 。 

程序 中 最 利用 的 三 大 数据 结构 是 字符 串 、 数 组 和 上 映 射 。 字 符 串 是 特 
殊 的 线性 表 ， 古 由 零 个 或 多 个 字符 组 成 的 有 限 序列 。 但 字符 串 和 数组 、 
映射 的 区 列 在 于 ， 字 符 串 是 被 作为 一 个 整体 来 关注 和 使 用 的 ;而 数组 和 
了 喘 射 关注 最 多 的 是 其 中 的 元 兹 及 它们 之 间 的 关系 。 所 以 ， 数 组 和 映射 也 
航 称 为 集合 类 型 。Rust 作 为 一 门 现 代 高 级 语言 ， 也 目 然 为 这 三 大 数据 疆 
构 提 供 了 丰富 的 操作 支持 。 


8.1 FIFE 


在 编程 中 字符 串 具 有 非常 重要 的 地 位 。 当 你 在 看 互联 网 上 的 某 篇 博 
客 ， 或 者 去 电 商 网 站 购物 时 ， 所 看 到 的 商品 名 称 或 价格 等 信息 都 是 用 字 
符 串 来 表示 的 。 众 所 周知 ， 计 算 机 压 层 只 存储 0 和 1 这 两 个 数字 ， 如 果 想 
让 计算 机 处 理 各 种 字符 串 ， 就 必须 建立 字符 和 特定 数字 的 一 一 映射 关 
系 。 比 如 ， 想 让 计算 机 存储 字符 A ， 则 存储 二 进 制 数 0100_0001 , Æ 
证 取 的 时 候 ， 再 将 0100_0001 显示 为 字符 A， 这 样 就 将 字符 A 和 
0100_0001 建 并 了 一 一 映射 关系 。 这 种 方案 ， 束 叫 作 字 符 编 码 
(Character Encoding) . 


8.1.1 字符 编码 


最 早 的 字符 编码 就 是 常见 的 ASCII 编 码 。 因 为 计算 机 起 源 于 美国 ， 
美国 是 以 英语 为 母语 的 国家 ， 所 以 ASCII 人 码 表 中 只 记录 了 英文 字母 大 小 
写 和 一 些 常 用 的 基本 符号 ， 并 使 用 0 一 127 的 数字 来 表示 它们 。 最 大 数字 
127 的 二 进 制 数 是 1111111， 所 以 用 1 字 节 《8 比特 位 ) 足以 表示 全 部 
ASCII 编 码 。 

随 独 计算 机 的 普及 ， 只 有 更 文字 母 的 ASCII 人 码 表 已 不 能 满足 世界 各 
地 人 们 的 需求 。 因 此 出 现 了 很 多 编码 标准 ， 比 如 GB2312 就 是 我 国 基于 
ASCII 编 码 进行 中 文 扩 充 以 后 产生 的 ， 可 以 表示 6000 多 个 汉字 。 慢 乙 
地 ，GB2312 也 无 法 渍 足 和 需求 了 ， 于 是 叉 出 现 了 GBK 编 码 ， 它 除 包括 
GB2312 中 的 汉字 之 外 ， 又 扩充 了 近 2 万 个 汉字 。 再 后 来 ， 为 了 兼容 少数 
民族 的 语言 ， 又 扩充 成 GB18030 编 码 。 而 与 此 同时 ， 日本、 韩国 等 其 他 
国家 也 都 分 别 创 造 了 属于 自己 语言 的 字符 编码 标准 。 这 样 市 来 的 后 果 整 
是 ， 如 果 想 同时 显示 多 个 国家 的 文字 ， 残 必须 在 计算 机 中 安装 多 套 字 符 
编码 系统 ， 这 束 市 来 了 诸多 不 便 ，。 

为 了 解决 这 个 问题 ， 国 际 标准 化 组 织 制定 了 通用 的 多 字 节 编码 字符 
集 ， 也 就 是 Unicode 字 符 集 。Unicode 字符 集 相 当 于 一 张 表 ， 其 中 包含 
了 世界 上 上 所 有 语言 中 可 能 出 现 的 字符 ， 每 个 字符 对 应 一 个 非 负 整数 ， 议 
数字 称 为 但 点 (Code Point) 。 这 些 人 码 点 也 分 为 不 同 的 类 型 ， 包 括 标 量 
{4 (Scala Value)  、 代 理 对 人 码 点 、 非 学 人 符 公 点、 保留 公 点 和 私有 公 


点 。 其 中 标量 值 最 常用 ， 它 是 指 实 际 存在 对 应 字符 的 码 位 ， 其 范围 是 
0x0000~O0xD7FF 和 OxE000~0x10FFFFPN EX. Unicode 字符 集 只 规定 了 
字符 所 对 应 的 码 点 ， 却 没有 指定 如 何 存储 。 如 果 和 直接 存储 人 码 位 ， 则 太 耗 
忱 空间 了 ， 因 为 Unicode 字 符 集 的 每 个 字符 都 占 4 字 节 ， 传 输 效 率 非 负 
低 。 虽 然 Unicode 字 符 集 解决 了 字符 通用 的 问题 ， 但 是 必须 寻求 另外 一 
种 存储 方式 ， 在 保证 Unicode 字 符 集 通用 的 情况 下 更 加 市 约 流量 和 硬盘 
空间 。 这 种 存储 方式 就 是 码 元 (Code Unit) ”组 成 的 序列 ， 如 图 8-1 所 
示 。 


mM FTI emoji 


Code Point U+0x41 U+1F600 


UTF-8 
Fede ind 0x41 OxFO Ox9F 0x98 0x84 


Byte 





图 8-1: 码 位 和 码 元 对 应 关系 示意 图 

但 元 是 指 用 于 处 理 和 交换 编码 文本 的 最 小 比特 组 合 。 比 如 计算 机 处 
理 字 符 的 最 小 单位 1 字 节 束 是 一 个 码 元 。 通 过 将 Unicode 标 量 值 和 三 元 序 
列 建立 一 一 映射 关系 ， 就 构成 了 编码 表 。 在 Unicode 中 一 共有 三 种 这 样 
的 字符 编码 表 : UTF-8、UTF-16 和 UTF-32， 它 们 正好 对 应 了 1 字 节 、2 字 
节 和 4 字 节 的 码 元 。 对 于 UTF-16 和 UTF-32 来 说 ， 因 为 它们 的 码 元 分 别 是 
2 字 节 和 4 字 市 ， 所 以 束 得 考虑 字 市 序 问 题 ， 而 对 于 UTF-8 来 说 ， 一 个 公 
元 只 有 1 字 方 ， 所 以 不 存在 字 市 序 问题 ， 可 以 直接 存储 。 

UTF-8 是 以 1 字 节 为 编码 单位 的 可 变 长 编码 ， 它 根据 一 定 的 规则 将 
但 位 编码 为 1 一 4 字 闻 ， 如 图 8-2 所 示 。 


Unicode 范 围 UTF-8 编 码 ( 1~4 字 节 ) 


U+ 0000 ~ U+ 007F OXXXAXAR 


U+ 0080 ~ U+ O7FF 110XXXXX 10XXXXXX 


U+ 0800 ~ U+ FFFF 1110XXXX 10XXXXXX 10XXXXXX 


U+10000 ~ U+1FFFF 11110XXX 10XXXXXX 10XXXXXX 10XXXXXX 





图 8-2: UTF-8 编 码 规则 示意 

UTF-8 编 码 规 则 大 致 如 下 : 

当 一 个 字符 在 ASCII 码 的 范围 《兼容 ASCII 权 ) 内 时 ， 就 用 1 字 节 
表示 ， 因 为 ASCII 码 中 的 字符 最 多 使 用 7 个 比特 位 ， 所 以 前 面 需 要 补 0。 

. 当 一 个 字符 占用 了 mn SIN, GA AEA En 位 设置 为 1， 第 n +1 
位 设置 为 0， 后 面 字 节 的 前 两 位 设置 为 10。 

ER 8-1 中 展示 的 汉字 “ 道 ” 来 说 ， 它 的 码 位 是 U+9053， 相 应 的 二 
进 制 表 示 为 1001_0000_0101_0011， 按 上 述 UTF-8 编码 规则 进行 编码 ， 
则 变 为 字 节 序列 1110_1001 10_000001 10_010011， 用 十 六 进 制 表示 的 
话 ， 就 是 0xE90x810x93。 

像 这 种 将 Unicode 人 码 位 转换 为 字 刷 序列 的 过 程 ， 束 叫 作 编码 
(Encode) ; 有 反 过 来 ， 将 编码 字 节 序列 转变 为 字符 集中 人 码 位 的 过 程 ， 
WHU EREE (Decode) 

UTF-84 5 H UF Ach it E E E pr a E P R i TR ES E l E 
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保证 了 在 传输 过 程 中 不 会 错 判 字符 。 想 一 想 ， 如 果 只 是 按 Unicode 码 位 
和 存储， 则 在 传输 过 程 中 是 按 固 定 的 字 市 长 上 度 来 识别 字符 的 ， 如 果 在 传输 
过 程 中 出 现 问 题 ， 就 会 发 生 错 判 字符 的 可 能 。 正 古 因为 这 些 优点 ， 
UTF-8 才 能 家 广泛 应 用 于 互联 网 中 。 

整个 过 程 如 图 8-3 所 示 。 


Unicode 
Coce romt ©1001 0000 0101 0011 0000 0101 0011 


1001 000001 010011 


| 1110 XXXX 10 XXXXXX 10 XXXXXX 


11101001 10000001 10010011 10 000001 10010017 


oxE9 ol os Ox81 0x93 





图 8-3: UTF-8 编 码 和 解码 过 程 示意 图 
图 8-3 展 示 了 从 Unicode 码 位 编码 到 UTEF-8 的 过 程 。 也 可 以 从 代码 中 
得 到 印证 ， 如 代码 清单 8-1 所 示 。 
代码 清单 8-1: 字符 串 编 码 示例 


Le Use Sade Sir 

Z fn main() { 

5 let tao = str::from utf8(&[QxE9u8, 0x8lus8, 0x93u8]) -unwrap () ; 
4 assert eq! (" ia", tao); 

Fa assert eq! ("ia", String::from("\u{9053}")); 
6 let unicode x = 0x9053; 

7 let uti x hex = Oxeys1937 

8 let utf x bin = 0b111010011000000110010011; 
zA printini ("unicode x: {:ib}", unicode x); 

LO, printin: ("utf x hex: {:b)", utf x hex); 

lis printini ("ult x bin: Uxisx}", uti x bin); 
Le ee ok 


在 代码 清单 8-1 中 ， 使 用 str 模 顽 提 供 的 from_utf8 方 法 并 为 其 传递 一 
个 UTF-8 字 节 序 列 &[0xE9u8，0x81u8，0x93u8] 作为 参数 ， 将 其 转换 为 
字符 串 " 道 " 。 在 Rust 中 ， 使 用 ug8 Ke AA, WRIA A Hus 
后 缀 ，Rust 也 会 通过 from_utf8 的 函数 签名 推导 出 此 数组 参数 为 8 类 型 数 
组 。 也 可 以 通过 String: : from ( "\u{9053}" ) 方法 将 一 个 十 六 进 制 形 
式 的 Unicode 码 位 转换 为 字符 串 " 道 "。 


代码 第 6 一 8 行 ， 分 别 使 用 0x 和 0b 前 绥 声 明了 十 六 进 制 和 二 进 制 形式 
的 变量 ， 它 们 实际 上 是 字符 串 " 道 " 的 十 六 进 制 形式 的 码 位 ， 以 及 
UTF-8 编 码 之 后 的 十 六 进 制 和 二 进 制 表示 。 通 过 printmn! 输出 语句 可 以 
将 它们 转换 为 对 应 的 二 进 制 和 十 六 进 制 形式 的 结果 ， 与 图 8-3 所 示 一 
BX 


i> At 


8.1.2 IT 

Rust( H chark REREN. char AY 1 H 4 BU -5 Unicode 
量 值 一 一 对 应 ， 如 代码 清单 8-2 所 示 。 

代码 清单 8-2: 字符 与 标量 值 一 一 对 应 


Ls EO aL) | 

Ra let tao = ' 道 '， 

Ja let tao u3s2 = tao as udi 

4. assert eq! (36947; tao 032); 

5. Prantl ("UP se", tae u32y a yy 0+2053 

6 println! ("{}", tao.escape unicode()); // \u{9053} 

7 assert eq! (char::from(65), ‘'A'); 

8 assert eq! (std::char::from u32(0x9053), Some ('i4')); 

3 assert eq! (std::char::from u32 (36947), Some('i#")); 
( 


tO, assert eg; 
Lt es 

FEASTS 8-247, FEHR AAP! 道 "' 。 注 意 ， 这 里 使 用 单 引 号 来 
定义 字符 ， 使 用 双 引 号 定义 的 是 字符 串 字 面 量 。 在 Rust 中 每 个 char 关 型 
的 字符 都 代表 一 个 有 效 的 u32 类 型 的 整数 ， 但 不 是 每 个 u32 闫 型 的 整数 
都 能 代表 一 个 有 效 的 字符 ， 因 为 并 不 是 每 个 整数 都 属于 Unicode 标量 
值 ， 如 代码 第 10 行 中 的 数字 ， 将 会 返回 None。 

代码 第 3 行 ， 通 过 as 将 char 关 型 转换 为 u32 关 型 ， 那 么 字符 tao 对 应 的 
u32 整 数值 是 36947。 通 过 代码 第 5 行 的 println! 语句 打印 其 十 六 进 制 形式 
的 值 为 U+9053， 正 是 汉字 “ 道 ? 对 应 的 Unicode 标 量 值 。 通 过 char 类 型 内 
建 的 escape_unicode 方 法 也 可 以 得 到 其 Unicode 标 量 值 。 

为 了 能 够 存储 任何 Unicode 标 量 值 ，Rust 规 定 每 个 字符 都 占 4 字 市 ， 
如 代码 清单 8-3 所 示 。 


std: pehar: from 有 2 


代码 清单 8-3: FE PAIR A SFT BBE PRE 


le Ef Maan) { 

his let mut b = [0; 3]; 

3 let tao = 'i#'; 

4. let tao str = tao.encode utf8(&mut b); 
By assert eq! (" 道 "， tao str); 

6. assert eqi {sp bagyvlen ubiSi)]i? 


F } 

在 代码 清单 8-3 中 定义 了 一 个 可 杰 数 组 b， 将 其 作为 参数 传 入 字符 内 
建 的 encode_utf8 方 法 ， 将 字符 转换 为 一 个 字符 串 字 面 量 。 这 里 值得 注意 
的 是 ， 如 果 将 数组 b 的 长 度 改 为 1 或 2， 则 无 法 将 tao 转 换 为 字符 串 ， 因 为 
字符 TE! 的 UTF-8 编 但 占 3 字 节 。 上 所 以 ， 如 果 要 转换 为 合法 的 字符 
串 ， 则 数组 b 的 长 度 最 少 为 3。 通 过 代码 第 6 行 的 字符 内 建 的 len_utf8 方 
法 ， 也 可 以 获得 字符 tao 按 UTF-8 编 但 的 字 节 长度。 

需要 注意 的 是 ， 只 有 包含 单个 Unicode 标 量 值 〈 实 际 码 位 ) 的 才能 
被 声明 为 字符 ， 如 代码 清单 8-4 所 示 。 

代码 清单 8-4: 包含 两 个 码 位 的 字符 示例 


1. fn main() { 

a let e = 'é'; 

ce 竹下 工效 下 上 而 上 人 {se yy e BS ws2) 5 
4 } 


编译 代码 清单 8-4， 会 出 现 如 下 错误 : 
error: character literal may only contain one codepoint: 'é' 
A let e = 'e'; 

| AKAN 

错误 提示 说 明 ， 字 从 e 所 代表 的 拉丁 小 写字 母 6 包 含 的 码 位 不 止 一 
个 ， 不 能 声明 为 字符 。 事 实 上 ， 它 包含 两 个 码 位 。 从 Rust 1.30 版 本 起 ， 
开始 支持 多 人 码 位 字符 ， 该 段 代码 将 不 会 报错 。 

作为 基本 原生 类 型 ，char 提 供 了 一 些 内 建 方 法 帮助 开 友 者 来 方便 处 
理 字 符 。 人 代码 清单 8-5 中 罗列 了 一 些 各 用 方法 的 示例 。 

代码 清单 8-5: 字符 内 建 的 第 用 方法 示例 


Ll. £8 MALSA) { 

fs assert eq! (true; ‘£'.is @daigit (le) ) ; 
Sa assert eq! (Some (13); “f".~to digit (lo)); 
4. assert! ('a’.is lowércase() ) > 

Dis assert! (!'i@'.is lowercase()); 

zr assert! (!"a'.«is uppercase ()); 

Ta assert! ('A* 119 uppercase ()); 

O a assert! (!'?'.is uppercase (j); 

Ds assert eqiit'a", I”. tO lewarease ()) ¢ 
| assert Eq.( By Dp te uppercase ()); 
LL g asserti(” ".i8 whitespace () ); 

IZ. assert! ('\u{A0}'.is whitespace ()); 
18 P assert! (!'ai'.is whitespace ()); 

14. assert! 本 SB alphabetic () ) 3 

15. assert! ('®'.is alphabetic()); 

LG. ee ' Le @lphabetic () ) 7 

TAa assert! ('7".i1s_alphanumeric:() ); 

18. assert! ('K’.is alphanumeric ()); 

19. assert! ('#&'.is alphanumeric()); 

20) . SE alphanumerce () ) 

id 。 assert! (H ,LS cenbrol \) ) z 

LA i asserti {ig'is control ())% 

23% assert! ('Y'.is numeric()); 

24. 2 (' 7" .18 AuUMeErLSG iC) Yi 

LD a assert! ling .ie numerie [y]; 

26. assert! (!'#'.is numeric()); 

ZT println! ("{}", '\r'.escape default ()); 
Bhae | 


代码 清单 8-5 中 所 罗列 方法 说 明 如 下 : 
is digit (16) ， 用 于 判断 给 定 字 人 符 是 含 属于 十 六 进 制 形式 。 如 末 
参数 为 10， 则 判断 是 人 否 为 十 进 制 形式 。 


to_digit (16) ， 用 于 将 给 定 字 从 转换 为 十 六 进 制 形式 。 如 果 参 数 
为 10， 则 将 给 定 字 符 转 换 为 十 进 制 形 式 。 


”is_lowercase， 用 于 判断 给 定 字符 是 否 为 小 写 的 。 作 用 于 Unicode 
字符 集中 具有 Lowercase 属 性 的 字符 。 
”is_uppercase， 用 于 判断 给 定 字 符 是 否 为 大 与 的 。 作 用 于 Unicode 
字符 集中 其 有 Uppercase 属 性 的 字符 。 
to_lowercase， 用 于 将 给 定 字 符 转 换 为 小 与 的 。 作 用 于 Unicode 字 
中 具有 Lowercase 属 性 的 字符 。 
to_uppercase， 用 于 将 给 定 字符 转换 为 大 与 的 。 作 用 于 Unicode 字 
中 具有 Uppercase 属 性 的 字符 。 
:is_whitespace， 用 于 判断 给 定 字 符 〈 或 十 六 进 制 形式 的 码 点 ) 和 古 合 


符 集 


符 集 


:is_alphabetic， 用 于 判断 给 定 字 符 是 否 为 字母 。 汉 字 也 算是 字母 。 

.is_alphanumeric， 用 于 判断 给 定 字符 是 否 为 字母 、 数 字 。 

.js_control， 用 于 判断 给 定 字 符 是 个 为 控制 符 。 

:is_numeric， 用 于 判断 给 定 字 符 是 售 为 数字 。 

escape_default， 用 于 转 义 t、\r、\n、 蛙 引号 、 双 引号 、 反 和 斜 杠 等 

特殊 符号 。 

8.1.3 FFT TR 

字符 串 是 由 字符 组 成 的 有 限 友 列 。 字 符 可 以 用 整数 值 直接 表示 
Unicode 标 量 值 ， 然 而 字符 串 却 不 能 ， 因 为 字符 串 不 能 人 确定 大 小 ， 所 以 
在 Rust 中 字符 串 是 UTF-8 编码 序列 。 出 于 内 存 安全 的 考虑 ， 在 Rust 中 
字符 串 分 为 以 下 几 种 类 型 . 

:str ， 表 示 固 定 长 上 度 的 字符 串 。 

-String ， 表 示 可 增长 的 字符 串 。 

:CStr ， 表 示 由 C 分 配 而 被 Rust 信 用 的 字符 串 ， 一 般 用 于 和 C 语 言 交 
H. 

CString ， 表 示 由 Rust 分 配 且 可 以 传递 给 C 函 数 使 用 的 C 字 符 串 ， 
同样 用 于 和 C 语 言 交 互 。 

“ OsStr ， 表 示 和 操作 系统 相关 的 字符 串 。 这 十 为 了 莱 容 Windows 系 
统 。 


-OsString ， 表 示 OsStr 的 可 变 版 本 。 与 Rust 字 人 符 串 可 以 相互 转换 。 
:Path ， 表 示 路 径 ， 定 义 于 std，: path 模 块 中 。Path 包 装 了 OsStr。 
PathBuf ”， 跟 Path 配 对 ， 是 Path 的 可 变 版 本 。PathBuf 包 装 了 

OsString。 

但 是 在 Rust 中 最 常用 的 字符 串 是 str 和 String。 在 第 3 章 中 已 经 介绍 过 
str 属 于 动态 大 小 类 型 DST) ， 在 编 详 期 并 不 能 确定 其 大 小 ， 所 以 在 程 
序 中 最 常见 到 的 是 str 的 切片 (Slice ) 类 型 &str。&str 代 表 的 是 不 可 变 的 
UTF-8 字 市 序列 ， 创 建 后 无 法 再 为 其 追加 内 容 或 更 改 其 内 容 。&str 类 型 
的 字符 串 可 以 存储 在 任意 地 方 : 

HATAK 。 有 有 代表 性 的 是 字符 串 字 和 面 量 ，&” static str 类 型 的 字 
符 串 被 直接 存储 到 已 编 详 的 可 执行 文件 中 ， 随 看 程序 一 起 加 载 司 动 。 

HES Bc 。 如 果 &str 类 型 的 字符 串 是 通过 堆 String 类 型 的 字符 串 取 切 
片 生 成 的 ， 则 存储 在 堆 上 。 因 为 String 类 型 的 字符 串 是 堆 分 配 的 ，&str 
只 不 过 是 其 在 堆 上 的 切片 。 

栈 分 配 ” 。 比 如 使 用 str: : from_utf8 方 法 ， 束 可 以 将 栈 分 配 的 

[u8; N] 数 组 转换 为 一 个 &str 字 符 串 ， 如 代码 清单 8-1 所 示 。 

与 &str 关 型 相对 应 的 是 String 关 型 的 字符 串 。&str 是 一 个 引用 类 型 ， 
而 String 类 型 的 字符 串 拥 有 所 有 权 。String “是 由 标准 库 提 供 的 可 变 字符 
串 ， 可 以 在 创建 后 为 其 奶 加 内 容 或 更 改 其 内 容 。String 类 型 本 质 为 一 个 
成 员 变 量 是 Vec<u8> 关 型 的 结构 体 ， 所 以 它 是 直接 将 字符 内 容 存 放 于 
堆 中 的 。String 类 型 由 三 部 分 组 成 : 指 同 堆 中 宇和 序列 的 指针 Cas_ptr 
方法 ) 、 记 录 堆 中 学 市 序列 的 字 市 长 度 (len 方 法 ) 和 堆 分 配 的 容量 
(capacity 方 法 ) ， 如 代码 清单 8-6 所 示 。 

代码 清单 8-6: 组 成 String 类 型 的 三 部 分 


fn main() { 
let mut. a = String: :from(“foou"™) ; 


Pprincini lL LB} e Axes Bert} ) s 


1 
2 
E 
4. Printlnt ("1 'or y Gals 
5 assert eqi(a.len(), 5); 
6 a.reserve (10); 
Ts assert eq! (a.capacirty(), 15); 
Ss } 
在 代码 清单 8-6 中 ， 使 用 as_ptr 获 取 的 是 扒 中 字 贡 序列 的 指针 地 址 ， 
而 通过 引用 操作 符 &a 得 到 的 地 址 为 字符 串 变 量 在 栈 上 指针 的 地 址 ， 注 
意 这 两 个 是 不 同 的 指针 。 
代码 第 5 行 ， 退 过 len 方 法 获取 的 是 堆 中 学 市 序列 的 字 市 数 ， 而 非 字 
从 个 数 。 
代码 第 6 行 ，reserve 方 法 可 以 为 字符 串 再 次 分 配 容 量 。 本 例 中 分 配 
了 10 字 节 ， 所 以 第 7 行 通过 capacity 获 取 的 字符 串 堆 中 已 分 配 容量 为 15 字 
节 ， 因 为 要 加 上 已 有 的 5 字 节 容量 。 
Rust 提 供 了 多 种 方法 来 创建 &str 和 String 类 型 的 字符 串 ， 如 代码 清单 
8-7 所 示 。 
代码 清单 8-7: 创建 字符 串 的 各 种 方法 示例 


L fn main) í 

2 let string: String = String::new(); 

3 assert: eqi("", string); 

4 Let string: String = String::from("hello rust”); 
Jo ANSETE e9! nels POSEY SCrLNGI 7 

6 let stringy String = String?::with capacity (20) y 
7 assert Sou "yy string); 

8 let Stro g*statie str = "the tao of ruse"; 

9 let string: String = 

Le str, chars () talber{|¢| icis whitespace (ly) . collect) ; 
Lis assert eg. ("Eheracet rust"; SEring) J 

Ie Let string? String = str.to owned {) 7 

L323. asseet ec! ("the Teo of Fuse”, SErangyj 

14. Leg strings: String = str.to string(); 

13 let stre sitr = €straing(llsslo)]; 

Lia assert Soi EUS y SLEJ? 

i A G 


在 代码 清单 8-7 中 ， 人 代码 第 2 行使 用 String: : new 方 法 来 创建 空 字符 
P, {ESC bp _ EIA IT EFR EH _E FT ee 20 |] 

代码 第 4 行 ， 通 过 String: : from 方 法 使 用 字符 串 字面 量 作为 参数 来 
创建 字符 串 ， 这 是 因为 String 类 型 实现 了 From trait. 

代码 第 6 行 ， 通 过 String: : with_capacity 方 法 来 创建 空 字 符 串 ， 但 
是 与 String: : new 方 法 不 同 的 是 ，with_capacity 方 法 接收 一 个 usize 类 型 
的 参数 ， 用 于 指定 创建 字符 串 预 先 要 在 推 上 分 配 的 容量 空间 。 此 例 中 指 
定 的 参数 是 20， 则 会 在 堆 中 分 配 至 少 20 字 市 的 空间 。 如 果 预 先知 道 最 终 
要 创建 的 字符 串 长 度 ， 则 用 此 方法 可 以 降低 分 配 扒 空 间 的 频率 。 这 里 需 
要 注意 的 是 ， 容 量 只 是 存储 空间 《比如 推 ) 的 一 种 刻度 ， 实 际 申请 的 扒 
内 存 空 间 为 每 个 字符 的 字 节 大 小 乘 以 容量 值 。 

代码 第 8 行 ， 创 建 的 是 字符 串 字 耐量， 为 &”static str 关 型 。 

代码 第 9 行 ， 退 过 第 8 行 创建 的 str 调 用 chars 方 法 返回 一 个 迭代 上 右 ， 然 
后 利用 达 代 器 的 collect 方 法 来 生成 String 类 型 的 字符 串 。 这 是 因为 chars 
HIRR EI AI RBS SEEN S FromIterator trait. 


代码 第 12 行 和 第 14 行 ， 分 别 使 用 to_owned 和 to_string 方 法 将 &str 类 
型 转换 为 String 类 型 的 字符 串 。 两 个 方法 的 性 能 相 天 无 几 ，to_owned 方 
法 利用 &str 切片 字 节 序列 生成 新 的 String 字 符 串 ，to_string 方 法 是 对 
String: : from #28. 

代码 第 15 行 ， 使 用 切片 语法 ， 从 String 字 符 串 中 获取 索引 第 11 一 14 
AS FF ZAM FF BF 


8.1.4 字符 串 的 两 种 处 理 方式 


Rust 中 的 字符 串 不 能 使 用 索引 访问 其 中 的 字符 ， 因 为 字符 串 是 UTF- 
8 字 节 序列 ， 到 底 是 返回 字 节 还 是 码 点 是 一 个 问题 。 但 是 Rust 提 供 了 
bytes 和 chars 两 个 方法 来 分 别 返 回 按 字 和 和 投 字 符 友 代 的 友 代 器 。 所 
以 ， 在 Rust 中 对 字符 串 的 操作 大 致 分 为 丙种 方式 : FAE AGRE 
从 处 理 。 

使 用 chars 和 bytes 方 法 示例 如 代码 清单 8-8 所 示 。 

代码 清单 8-8: 使 用 chars 和 bytes 方 法 示例 


le EA Main() | 

Bis Let SEP = “penos T] 

Bis let mut chars = str. chars (); 

4. assert eq! (Seme ("bp"), chars.next ()) Fz 
Ja assert eq: (some ('o")y thars<next()) 7 
Gis assert eq: (oome ("rr"), cChars«next () ) 7 
Ts assert eq! (Some (’o"), Chars«next ())+¢ 
ah assert eg! (S0me (°S"), Chars. Nest ().) 7 
os let mut bytes = str.bytes(); 

Le a assert eg! (6, STr.len() 7 

ih assert eq! (seme (20); SLES. Nex ly) 

Li i assert eG: (Some (lili), Byees.next ()); 
LS o assert eq: (Some(ll4), bytes.next ()); 
14. assert eq! (Seme(l9a), bytes.next () ) ; 
LD assert eq! (Some (1oz), Dbybes.mext()); 
1.6 assert eq! (seme (215), bytes.next()) +: 


| 
~] 
一 一 


FETS B8-8'F, RAGS 3 47 1 H chars 77 753K [Al Charsi& ARA, 
Charsi& {Vas Hnext 77 IE 6 FEES LET IAQ. MARESTE bytes 7 
TAI E ee Bytesiž as, Bytes as next T ie Fe ET IAN 
有 的。 字符 串 的 一 些 内 建 方 法 也 默认 按 字 市 来 处 理 ， 比 如 代码 第 10 行 中 用 
到 的 len 方 法 ， 返 回 的 是 字符 串 字 节 长 度 ， 而 非 字 符 长 度 。 

虽然 字符 串 不 能 按 索 引 来 访问 字符 ， 但 Rust 提 供 了 另外 两 个 方法 : 
get 和 get_mut， 可 以 通过 指定 索引 泡 围 来 获取 字符 串 切 厂 ， 并 且 Rust 默 
认 会 检查 字符 串 的 序列 是 含 为 有 效 的 UTF-8 序 列 ， 如 代码 清单 8-9 所 示 。 

代码 清单 8-9: 使 用 get 和 get_mut 方 法 示例 


lw Ti ein) f 

Zn Let mut v = Strings: tromi" poros" Y; 

Sa assert eq! (some ("ph"), Vegen 0s sa Lh) 
4. assert eo! (Some ("oO"), V.gel ts...) ) # 
Ss Assert cg! (Some ("orcs"), waget.CL. «J )? 
is assertl(v.ger. mut(4..}).i8 none) ); 

Ts aAssertl (veils char boundary (4) )s 

B Assert AVOL MU). By LB none) I? 

Ds assert! (7uget, MAE C..42).08 mene (I)i 
Lae J 


在 代码 清单 8-9 中 使 用 的 是 String 类 型 的 字符 串 ， 因 为 只 有 String 字 
AY ERP Fe TARA TRESS ~ 617, wget AEA SU, FRA 
到 了 预期 的 字符 串 切 片 ， 注 意 这 里 是 Option 类 型 。 代 码 第 6 行 ， 传 递 的 
索引 范围 是 从 4 开始 的 ，4 正 好 是 字符 6 的 字 贡 序列 中 间 地 市 ， 相 当 于 含 
径 了 字符 6 的 第 一 字 节 ， 这 目 然 是 非法 的 UTF-8 序 列 ， 所 以 此 时 Rust 会 返 
回 None， 从 而 各 免 了 线程 朋 误 。 也 可 以 通过 is_char boundary 方法 来 验 
证 某 个 索引 位 置 是 否 为 合法 的 字符 边界 ， 代 码 第 7 行 就 验证 了 第 4 个 过 相 
位 置 为 非法 的 字符 边界 。 

所 以 ， 在 使 用 字符 串 内 建 的 split_at 和 split_at_mnut 方 法 分 割 字 符 串 
时 ， 需 要 注意 ， 一 定 要 使 用 合法 的 字符 串 边 界 么 引 ， 人 否则 瓯 会 引起 线程 
月 尝 ， 如 代码 清单 8-10 所 示 。 

代码 清 单 8-10: 使 用 split_at 方 法 示例 


1 fn main() { 

2 let s = "Per Martin-Lof"; 

3 let (first, last) = g split et(12Z);> 

4. Sert eg! ("Per Martin-b", TLESTI? 

5 assert eg! ("of", last); 

6 // ‘main! panicked: byte index 13 is not a char boundary 
7 /f let (first, last) = geBplit ab(l3); 

8 } 


在 代码 清单 8-10 中 ， 使 用 split_at 方 法 指定 了 字符 串 的 分 割 索 引 位 
兽 。 代 公 第 3 行 指定 的 是 12， 正 好 是 一 个 合法 的 字符 边界 ， 所 以 可 以 将 
字符 串 合 法 地 分 成 两 部 分 。 但 是 注释 挥 的 第 7 行 ， 给 定 的 索引 值 为 13， 
恰好 是 字符 6 的 字 贡 序列 中 间 人 位置， 为 非法 的 字符 边界 ， 所 以 引 及 线程 
HH ÑH o 

KE, FEA ASAD BEAR eI, BEE EIR Ih ete AT ET WY 
以 避免 友 生 预 期 之 外 的 错误 。 


8.1.5 字符 串 的 修改 


一 般 情 况 下 ， 如 果 需 要 修改 字符 串 ， 则 使 用 String 类 型 。 修 改 字符 
串 大 致 分 为 退 加 、 插 和 入、 连接 、 更 新 和 删除 5 种 情形 。 

退 加 字符 串 

对 于 追加 的 情形 ，Rust 提 供 了 push 和 push_str 两 个 方法 ， 如 代码 清单 
8-11 所 示 。 

代码 清单 8-11: 使 用 push 和 push_str 方 法 示例 


Le Em maaan) q 


pa let mut. helio = Straing::from("Hello, ™); 
cn hello.push('R'); 

4. nelle. pash Str. "USE Tj} 

Da assert eq!i("Hell6é, Rust!", hello) ; 

Sis } 


在 代码 清单 8-11 中 ， 使 用 push 方 法 为 String 类 型 字符 串 hello 奶 加 字 
和 侍 ， 使 用 push_str 方 法 为 hello 退 加 &str 交 型 的 字符 串 切 族 。push 和 


push_str 在 内 部 实现 上 其 实 是 类 似 的 ， 因 为 String 本 质 是 对 Vec<u8> 动 
态 数组 的 包装 ， 所 以 对 于 push 来 说 ， 如 扣 字 符 是 单字 节 的 ， 则 将 字符 转 
换 为 8 类 型 直接 退 加 到 Vec<u8> 尾 部 ， 如 果 是 多 字 节 的， 则 转换 为 
UTF-8 字 节 序 列 ， 通 过 Vec<u8> 的 extend_ from _ slice 方法 来 扩展 。 因 为 
push_str 接 收 的 是 &str 类 型 的 字符 串 切 片 ， 所 以 直接 使 用 
extend_from_slice 方 法 扩展 String 类 型 字符 串 的 内 部 Vec 二 u8 二 数组 。 

除了 上 面 两 个 方法 ， 也 可 以 通过 迭代 需 为 String 退 加 字符 串 ， 因 为 
String 实 现 Y Extend (tas, WS 8-12 AN 

代码 清单 8-12: 1E H Extend (4 4518 DU FF R 


le fñ Maing) | 

Lis let mut message = String::from("hello"); 

Fy message.extend([',', "Y's ‘u'].iter()); 

4. message.extend("st ".chars()); 

Dix message..extend("w o P 1 a™.split whitespace () ); 
6. assert eq! (“hello, rust world", message) ; 

7 } 


在 代码 清早 8-12 FP, String KEMERES Extend ARAF, 
所 以 可 以 使 用 extend DYE, HAA AIAN as. MIRT, iter 77 
773K [alter as AIRT, 18 chars 方法 返回 的 是 Chars RAF o 
代码 第 5 47, (HAA split whitespace DYK El HJ 7SplitwWhitespacerk{¥ 


BI 


AN o 

插入 字符 串 

如 果 想 从 字符 串 的 某 个 位 置 开始 插入 一 段 字 从 串 ， 则 需要 使 用 
insert 和 insert_str 方 法 ， 其 用 法 和 push/push_str 方 法 类 似 ， 如 代码 清单 8- 
13 所 示 。 

代码 清单 8-13: 使 用 insert 和 insert_ str 方法 插入 字符 串 


1. fn main() { 

fxs let mut s = String::with capacity (3) ; 
cP Seale Edis "ys 

4. S a msere tl, “a's 

Da S.inserct(2, a"): 


6. S. 2nSeFE StY(O, Doar) 
vs assert eg: (“bartoo”, Bl 
8. | 
在 代码 清单 8-13 中 ， 便 用 insert 方 法 ， 其 参数 为 要 插入 的 位 置 和 字 
#7; 而 使 用 insert_str 方 法 ， 其 参数 为 要 插入 的 位 置 和 字符 串 切片。 值得 
注意 的 是 ，insert 和 insert_ str 征 基 于 字 节 序列 的 索引 进行 操作 的 ， 其 内 
部 实现 会 通过 is_char_boundary 方法 来 判断 插入 的 位 置 是 否 为 合法 的 字 
IPA MRAMA, WE I ARTEA I o 
连接 字符 串 
String 类 型 的 字符 串 也 实现 了 Add<&str> 和 AddAssign< &str> 
两 个 trait， 这 意味 看 可 以 使 用 “+” 和 “+=” 操 作 和 从 来 连接 字符 串 ， 如 代 估 
清单 8-14 所 示 。 
代码 清早 8-14: 使 用 “+ ”和 “+ ”= 连接 字符 串 


二 { 

2 let left = “the tao .to string(); 

cP let mut right = “Rust”.to string(); 

4, assert eq!(left + " of " + &right,; “the tao of Rust"); 
is igh f= 11m} 

6. assert eq! (right, “Rust!"); 

la | 


在 代码 清香 8-14 中 ， 使 用 “+” 和 “+=” 操 作 和 从 连接 字符 串 ， 但 需要 注 
意 的 是 ， 操 作 符 右边 的 字符 串 为 切 厂 类 型 (&str) 。 在 代码 第 4 行 中 ， 
&right 实 为 &String 类 型 ， 但 是 因为 String 类 型 实现 了 Deref trait， 所 以 这 
里 执行 加 法 操作 时 目 动 解 引 用 为 &str 类 型 。 

更 新 字符 串 

因为 Rust 不 文 持 直接 投 索 引 操 作 字 符 串 中 的 字符 ， 一 些 彰 规 的 算法 
在 Rust 中 必然 无 法 使 用 。 比 如 想 修改 某 个 字符 串 中 符合 条 件 的 字符 为 大 
写 ， 允 无 法 直接 通过 索引 来 操作 ， 只 能 通过 进 代 器 的 方式 或 者 茶 些 
unsafe 方 法 ， 如 代码 清单 8-15 所 示 。 

代码 清单 8-15: 答 试 使 用 索引 来 操作 字符 串 


lL. use SEAS ASCL: 4 TASCALERE j 

2 Em main) a 

3 let a = String: tirom 工作 站 全 县 

d lët Mot. Tesült = S.1nte DYtSS[)]4 

Ja (Ole LE LE Lor Sahi T1] 

0 if 1% 2 == { 

7 resulti] = result[i)].te ascii lowercase () ; 
8 else { 

9. result(s] = ES01E[1] ce 55611 tppercase |); 
10 } 

Ly yy 

Ta; assert eg: ("fOSsaRak”", String: tirom UCIS (result) ,unwrap (J) 
Los | 


在 代码 清单 8-15 中 ， 通 过 into_bytes 方 法 将 字符 串 转 换 为 Vec<u8> 
序列 ， 这 样 就 可 以 使 用 索引 来 修改 它 的 内 容 了 。 然 后 通过 String: : 
from_utf8 Fit Vec<u8>#e4"AN Result<String, FromUtf8Error>, 
再 通过 unwrap 方 法 取出 Result 中 的 String 字 人 符 串 。 

代码 第 S~11 行 ， 在 result 4 WPA TA, WR aR 
引 是 偶数 ， 则 通过 to_ascii lowercase 方 法 将 其 转换 为 小 写 的 ;否则 ， 通 
过 to_ascii_uppercase 方 法 将 其 转换 为 大 写 的 。 注 意 ， 这 里 引入 了 std: : 
ascii: : {AsciiExt}， 因 为 result 现在 是 字 市 序列 ， 所 以 需要 使 用 标准 库 
中 提供 的 扩展 方法 。 

最 终 得 到 的 结果 字符 串 是 " fOoaBaR " ， 这 和 预期 的 结果 不 太 相 
符 ， 因 为 第 4 个 字符 a 的 大 写 应 该 是 A。 这 是 因为 to_ascii_ uppercase 和 
to ascii 1owercase 方 法 只 针对 ASCII 字 符 ，a 是 多 字 节 字符 ， 并 不 能 进行 
合法 的 转换 。 

代码 清单 8-15 展 示 了 Rust 中 的 String 字 符 串 无 法 用 在 其 他 语言 中 处 理 
字符 串 的 种 规 思 维 来 处 理 。Rnust 中 的 字符 串 永 远 都 是 UTF-8 字 节 序 列 。 
当然 ， 在 确定 的 字符 串 序列 中 ， 己 知 按 字 市 可 以 得 到 正确 处 理 的 情况 
下 ， 也 是 可 以 用 的 。 但 是 一 般 处 理 多 字 节 字符 串 的 情况 比较 多 ， 要 合法 
正确 地 操作 字符 串 ， 推 荐 使 用 按 字 和 从 来 达 代 ， 如 代码 清单 8-16 所 示 。 

代码 清单 8-16: FEIER RORI R 


1. fn main() { 

va Let s = Strang: sirom("toogbar") ; 

ce let s: String = s.chars().enumerate().map(|(i, c)| { 
4. if 1 3% 2 == 0 { 

Ds c.to lowercase () .te string () 
6. } else | 

Ta Ste uppercase () «to string () 
8 . } 

9. tI ,-@OLIGEE1) = 

LW) assert eq! ("fOoAbAr™, Sy? 

de J 


在 代码 清单 8-16 中 ， 使 用 chars 方 法 获得 Chars 迭 代 右 ， 然 后 通过 
enumerate 和 和 map 两 个 迭代 器 方法 对 字符 进行 处 理 ， 最 后 通过 collect 消 费 
IA ae Fe RA Strings, BIER A TZ ER o 

删除 字符 串 

Rust 标准 库 的 std: : string 模块 提供 了 一 些 专门 用 于 删除 字符 串 中 
字符 的 方法 ， 如 代码 清单 8-17 所 示 。 

代码 清单 8-17: 删除 字符 串 示 例 


ls Co J | 

Bia bet mut s = Strings :from(" helio is 
Big s.remove (3); 

4. assert cg. ( ls ss E)? 

Da De cdt (Seme ("Oo"), &.pop() ) F 

6. assert eq! (Some (’ Lb"), s.pop()); 

Ts assert eq! (some ("a"); &.<pop()); 

=e assert egi (i S)F 

9. bet MUE & = SLELINIS : fron halle")? 
LO. s.truncate'(s) 7 

Lis assert eg! ("ha™, BSB) 

Läs S.clear'() 7 

LS assert egi (S, ""); 

14. let mut s = Stuungu:trom("a 2s: alpha; D 18s beba™); 


1.5. LEE Beta offset = 6.fand ("6") .unwrap or(s.tleni) j; 


16. let t: String = Sdralmils beta offset) collect}; 
LF a assert eg! (ts "æ is alpha, ")? 

Ig: Assert eg: (ar "E 18 Detaj} 

13. S,drain(,.) 7 

Zu) . asser eg: Ws “Tz 

ala d 


STS 8-17 EAS S MIER EITE IAEN o 

REMERA BASE PS ES SEE EH EREE ER 
remove 方法 ， 如 代码 第 3 47, remove 的 参数 为 该 字符 的 起 始 索引 位 
置 。 这 里 需要 注意 ，remove 也 是 按 字 市 处 理 字 符 串 的 ， 如 果 给 定 的 过 
引 位 置 不 是 合法 的 字符 边界 ， 那 么 线程 束 会 朋 沉 。 可 以 将 该 方法 的 参数 
3 改 为 2， 然 后 看 看 有 何 结 采 。 

代码 第 S~7 行 ， 使 用 pop 方法 可 以 将 字符 串 结尾 的 字符 依次 弹 
出 ， 并 返回 该 字符 。 通 过 代码 第 8 行 可 以 看 出 ， 议 方法 同样 会 修改 字符 
He AN o 

代码 第 10 行 使 用 了 truncate 方 法 ， 访 方法 接收 系 引 位 置 为 参数 ， 并 
将 以 此 系 引 位 置 开 始 到 结尾 的 字符 全 部 移 除 。 此 行 指定 truncate 方 法 的 
参数 为 3， 那 么 第 3 位 正好 是 字符 a 的 字符 边界 ， 因 为 a 占 两 字 季 。 上 所 以 字 
符 串 $ 只 剩 下 了 “hoa”"。truncate 方 法 同样 是 按 字 节 进 行 操 作 的 ， 所 以 使 用 
时 需要 注意 ， 如 果 给 定 的 索引 位 置 不 是 合法 的 字符 边界 ， 则 同样 会 引发 
线程 朋 误 。 

代码 第 12 行 使 用 的 clear 方 法 ， 实 际 上 是 truncate 的 语法 糖 ， 只 要 给 
truncate 指 定 参 数 为 0， 那 么 承 可 以 规 岂 字符 串 中 的 全 部 字符 ， 达 到 clear 
的 效果 。 

代码 第 14 一 20 行 ， 使 用 drain 方 法 来 移 除 指定 范围 内 的 字符 。 代 但 第 
15 行 通过 find 方 法 ， 找 到 指定 字符 B 的 位 置 。 代 码 第 16 行 以 此 作为 范围 
的 起 始 位 置 ， 以 字符 串 结 尾 作 为 结束 位 置 ， 对 字符 串 进 行 移 除 ，drain 方 
EZR |B] Drainié (as, Fy CBA Se Drain t (R48 RAK CS RY AB E 


i> Pals 


FITE- 


8.1.6 TIFE REFR 


在 Rust 标 准 库 中 并 没有 提供 正则 表达 式 支 持 ， 这 是 因为 正则 表达 式 
算是 外 部 DSL， 如 果 直 接 将 其 引入 标准 库 中 ， 则 会 破坏 Rust 的 一 致 性 。 
因为 现成 的 正则 表达 式 引 擎 都 是 其 他 语言 实现 的 ， 比 如 C 语 言 。 除 非 完 
全 使 用 Rust 来 实现 。 目 前 Rust 文 持 的 正则 表达 式 引 人 擎 是 官方 实现 的 第 三 
方 包 regex ， 未 来 是 否 会 归 为 标准 库 中 ， 不 得 而 知 。 虽 然 Rust 在 标准 库 
中 不 提供 正则 表达 式 支 持 ， 但 它 提供 了 男 外 的 字符 串 罗 配 功 能 供 开 发 者 
使 用 ， 一 共 包 含 20 个 方法 。 这 20 个 方法 闻 盖 了 以 下 几 种 字符 捉 匹 配 操 
VE: 

. 存在 性 判断 。 相 关 方 法 包括 contains、starts with, ends with. 

位置 匹 配 。 相 天 方法 包括 find、rfind。 

分 割 字 符 串 。” 。 相 关 方 法 包括 split、rsplit、split_terminator、 
rsplit_terminator、splitn、rsplitn。 
tH SR VLA 。 相 关 方 法 包括 matches、rmatches、match indices、 
rmatch indices。 


删除 匹配 ” 。 相 关 方 法 包括 trim matches. trim left matches. 


trim_right_matches. 
FUL. FAK TIE replace, replacen. 
ATGEtHOR, KEJ RES AS_E By Wiig xe H ay ERARA R mK o 
存在 性 判断 
可 以 通过 contains 方 法 判断 字符 串 中 是 否 存 在 从 合 指定 条 件 的 字 
伯 ， 访 方法 返回 bool 类 型 ， 如 代码 清单 8-18 所 示 。 
代码 清单 8-18: 使 用 contains 方 法 示例 


lL. th main) í 

A let bananas = "bananas"; 

ep assert! (bananas.contains('a")); 

4.. assert! (bananas.contains("an")); 

Bi ASSErE! (bananas..contai ns (chat: iis Lowercase); 
6. assert! (bananas,.starnts with(’b’))?; 

Tx assert! ( bananes.ends with ("nana") )+ 

8. 


} 
注意 ， 在 代码 清单 8-18 中 ， 人 代码 第 3 一 5 行 中 contains 的 参数 是 三 种 不 


同 的 类 型 ， 分 别 为 char、&str 和 fn pointer， 这 是 因为 contains 是 一 个 渤 
型 方法 。 人 代码 清单 8-19 展示 了 std: : str 模 块 中 contains 方 法 的 源码 。 

Reis 28-19: std: : str 模 块 中 contains 方 法 的 源码 展示 
lL. pub fm contains<'a, P: Pattern<'a>>(é&'a self, pat: P) => bool 1 
ve core SLEISSUEBXE!: contains (self, pat) 

Se | 

从 代码 清单 8-19 可 以 看 出 ，contains 的 参数 pat 是 一 个 泛 型 ， 并 且 有 
一 个 Pattern 天 ′ a> 限定 。Pattern<′ a> 是 一 个 专门 用 于 搜索 长 / a str 
字符 串 的 模式 trait。Rust 中 的 char 类 型 、String、&str、&&str、&[char] 类 
型 ， 以 及 FnMut (char) -之 bool 的 财 包 均 已 实现 了 该 trait。 因 此 ， 
contains 才 可 以 接收 不 同类 型 的 值 作 为 参数 。 

回 到 代码 清单 8-18 中 ， 代 码 第 6 行 和 第 7 行 分 别 用 到 的 starts_with 和 
ends_with 与 contains 一 样 ， 也 可 以 接收 实现 了 Pattern<’ a> hJ EN 
参数 。 为 了 方便 描述 ， 暂 且 称 这 种 参数 为 pattern 参 数 。starts_with 和 
ends_with 分 别 用 于 判断 指定 的 pattern 参 数 是 否 为 字符 串 的 起 始 边 界 和 结 
束 边界 。 

SL B. VE AC 

OUR AE RTS EES Be AE ie, Ma DE find Wik, 
如 代码 清单 8-20 所 示 。 
代码 清单 8-20: 使 用 find 方 法 查找 字符 位 置 

to maint) í 

let s = "Lowe 4H. Léopard"; 

assert eq! (s.find("w'), some (s).) 
stand ("se"), Some (6j); 

Find ("36"), Some ij: 
atandi "e"; Some (lal 
tinadi" Leppard"); some (ls) ): 
EL Tos Same tis) ) i 


find (char: :is whitespace), Some (5) ); 


assert eg: 
assert ‘eq! 


assert eg; 


( 

( 

( 
BaSSSrt eal 
abeert eg. | 
assert egl 
( 


assert eq! (s.find(char;:i1s lowercase), some (1)); 


ew eal aw S a KN Ee 


e O » 


find AK FEB Ae pattenB AX. WH Sys 8-208) 以 看 出 ， 
find IEE U cE ME IAA FATT ERAN, wR [8] Option< 
usize> INAS; 如 果 没 有 找到 ， 则 会 返回 None。 对 于 代码 第 
行使 用 的 rfind 方 法 ， 表 示 从 右 癌 左 来 匹配 字符 串 ，r 前 绥 代 表 右 边 
(right) ， 所 以 它 返 回 的 结果 是 Some (13) 。 

分 割 字符 串 

如 条 想 通 过 指定 的 模式 来 分 割 字 人 符 串 ， 则 可 以 使 用 split 系列 方 
法 ， 如 代码 清单 8-21 HIZR o 

代码 清单 8-21: split 系 列 方法 使 用 示例 


1. fn main() { 

2 let s = "Lowe Æ Léopard"; 

5 let v = s.split( |c| 

4. (c as u32) >= (0x4E00 as u32) && (cas u32) <= (Ox9FA5 as u32) 
a ) collect: :<Vec<&str>>(); 

6 assert eqi(v, ["Loéwe ", " Léopard”]); 

q let v = "“abcldefXghi".split(|c| 

8 c == '1' || c == 'X' 

9. ) collect: :<Vec<éstr>>();; 

LO assert egi(v, [“abe", “det”, “ghi"]); 

Lis let v = "Mary had a little lambda" 

Le SOLLEN (a; * *} 

1D ， Collet: tVeccestr>> |) 2; 

LA a assert eg! (v; ["Mary", "had", "a little lambda"]); 

15 let v = "A.B.".split(".").collect: :<Vec<éstr>>() ;; 

16. BoBrt Gl iy; [MAT By OE 

‘ihe 要 let ¥ = "A.B." . split. terminator ('.') .OO LEG <Vec<sstr>> () i} 
18. assert eq! (v, ["A™, "B"])} 

19s let y = "As .Bs "split ("=") collects :<Vec<éstr>>() 7; 

20. rt Sal iy, Lae By "Sy PML 

OL a let y = "Ae. Be." SPLIT terminator (™.") .6oLLect i <Veccaste>> () fj 
Les assert eqi(v, | "Ay 7, "Bp “HJJ 

E35 4 


FET Ss 8-217, ARGS 2 77 EH Ph ost HB, VERE SL 


a Sl BPN. 

RIRIS, ERA split TID SEF Ps. split hik TA SC HE 
pattern 参 数 ， 该 方法 使 用 财 包 作为 参数 。 闭 包 的 行为 是 想 通 过 字符 串 中 
字符 的 码 位 范围 来 锁定 中 文字 符 ， 然 后 以 中 文字 符 作 为 字符 串 的 分 割 位 
置 ， 最 终 返 回 代 码 第 6 行 所 示 的 Vec 二 &str 二 类 型 数组 。 这 里 暂时 使 用 
U+4E00 一 U+9FA5 码 位 作为 中 文字 符 的 范围 ， 但 实际 上 这 征 不 太 严 谨 
的 ， 访 范围 并 没有 包含 全 部 的 中 文字 从 ， 这 里 仅 作 为 潮 示 之 用 。 因 为 在 
Rust 中 每 个 字符 的 但 位 对 应 于 一 个 u32 数 字 ， 上 所 以 在 财 包 中 使 用 as 将 字 
人 符 和 码 位 均 转 换 为 u32 进 行 比较 。 

WES 7~9 行 的 行为 同样 是 通过 闭 包 指定 的 条 件 来 分 割 字 人 符 串 
的 ， 最 终 得 到 代 代 第 10 行 所 示 的 数组 。 

代码 第 11 一 13 行 ， 使 用 了 splitn 方 法 ， 注 意 这 个 方法 的 命名 比 split 多 
了 一 个 nD， 这 个 n 代 表 指 定 分 割 的 数组 长 度 。 议 方法 的 第 一 个 参数 苞 是 指 
定 要 分 割 的 数组 长 上 度 ， 第 二 个 参数 为 要 分 割 的 pattern 参 数 。 最 终 的 分 割 
结果 正如 第 14 行 展示 的 那样 ， 是 一 个 长 度 为 3 的 数组 ， 也 就 是 包含 3 个 元 
me 

代码 第 15 一 22 行 ， 主 要 展示 了 split 和 split_terminator 方 法 的 区 别 。 顾 
名 思 义 ，terminator 为 终结 之 是， 通过 代码 可 以 看 出 ，split_terminator 会 
把 分 割 结 采 数组 最 后 一 位 出 现 的 空 字符 串 去 皂 。 

对 应 的 ， 也 存在 rsplit、rsplitn 和 和 rsplit_terminator 方 法 ， 它 们 均 是 按 
从 右 同 左 的 方 癌 进行 字符 匹配 的 。 那 为 什么 没有 1lsplit 之 类 的 方法 呢 ? 不 
要 筷 记 ，split 本 喘 的 匹配 方 癌 就 是 从 左 同 右 的 。 需 要 注意 的 是 ，split 系 
列 方法 返回 的 是 欠 代 左 ， 所 以 在 使 用 它们 时 最 后 需要 用 collect 来 消费 这 
se 

捕获 匹配 

在 处 理 字符 串 时 ， 最 第 见 的 一 个 需求 束 是 得 到 字符 串 中 区 配 菜 个 条 
件 的 字 和 全， 通 弟 通过 正则 表达 式 来 完成 。 在 Rust 中 ， 通 过 pattermn 参 数 配 
合 matches 系 列 方法 可 以 获得 同样 的 效 霖 ， 如 代 人 码 清 单 8-22 所 未 。 

代码 清单 8-22: matches 系 列 方法 使 用 示例 


Loe EB theta) d 

2 Let v = “abcrsczabcriyabc” 

3 smatches ("abe") «collects e<Vec<¢stre>(): 

4. aAsbert eg: (V; ["aAbe™, "abe", “aber |) 3 

s let 7 = “labeZabc3" 

6 yematches (chan: tas numeric) .coLlects: :<Vectisty>> () 7 
7 dert Gols La BB TA IDF 

8 let v = "abcXXXabcYYYabc" 

Dn -eh Indiees (Mabe). collects i" 2 () ; 

LU, assert eqli {yvy [(0, “abe™), (6, “abo"), (12, abe”) Ijz 
Lis let v = “abcxXXXabcYYYabc" 

Les hath INGLGes ("abo") collect tisVec< > ()} 

L3. assert eql iv, [(l2, "abe"}, (Gp TEBE]; (0, "aben 1); 
14. } 


在 代 但 清单 8-22 中 ， 代 码 第 2 行 和 第 3 行 ， 使 用 matches 方 法 来 获取 字 
符 串 中 匹配 到 的 元 素 。matches 方 法 返回 的 同样 是 欠 代 需 ， 所 以 需要 使 
用 collect HIK B74 (RAS ER BITE Aes PU SE ER, LEASES Vec 
<&str > KE MAHAR, WARRE 4 行 所 示 的 结果 。 

代码 第 5 行 和 第 6 行 ， 使 用 了 rmatches 方 法 ， 从 右 问 左 进行 小 配 。 注 
意 ， 最 终 得 到 的 数组 中 元 素 也 是 按 原 字符 串 从 右 回 左 依次 排列 的 。 

代码 第 8 行 和 第 9 行 ， 使 用 了 match_indices 方 法 ， 返 回 的 结果 是 元 组 
数组 ， 其 中 元 组 的 第 一 个 元 系 代 表 [ 匹 配 字 符 的 位 置 索 引 ， 第 二 个 元 系 为 
匹配 的 字符 本 身 。 从 方法 的 命名 来 看 ，ipndices 为 index 的 复数 形式 ， 在 语 
义 上 束 指 明了 匹配 结果 会 包含 索引 。 其 实在 标准 库 中 也 有 不 少 
以 ”indices” 结 尾 的 方法 名 ， 在 语义 上 都 表明 其 返回 值 会 包含 索引 。 

代码 第 11 行 和 第 12 行 ， 使 用 了 rmatch_indices 方 法 ， 它 同样 是 从 右 辐 
左 进行 下 配 的 。 

通过 matches 系 列 方法 ， 可 以 获得 最 终 匹 配 的 结果 数组 ， 然 后 按 需 
使 用 即 可 。 

删除 匹配 

在 std: : str 模块 中 提供 了 trim 系列 方法 ， 可 以 删除 字符 串 两 头 的 
指定 字符 ， 如 代码 清单 8-23 所 示 。 


代码 清单 8-23: trim 系 列 方法 使 用 示例 


fn main() { 

2 let s = " Hello\tworld\t"; 

ET assert eq! ("Hello\tworld", s.trim()); 

4 assert eq! ("Hello\tworld\t", s.trim left()); 
5 assert eq! (" Hello\tworld", s.trim right()); 
6 } 


在 代码 清单 8-23 中 用 到 的 trim 系 列 方法 ， 可 以 删除 字符 串 两 头 的 罕 
格 、 制 表 符 OO 和 换行 从 (\n)。 注 意 代 人 码 第 2 行 声 明 的 字符 串 s 是 以 
守 格 为 起 始 字 全、 以 Nt 为 结尾 字符 的 单个 字符 串 。 从 代码 第 3 行 可 以 看 
出 ，trim 方 法 将 左边 起 始 处 的 空格 和 右边 结尾 处 的 \t 痢 清除 了 。 

代码 第 4 行 和 第 5 行 中 用 到 的 trim_left 和 trim_right 分 别 用 于 去 除 左边 
和 右边 的 特定 字符 。 值 得 注意 的 是 ，trim、trim_left 和 trim _right 这 三 个 
方法 并 不 能 使 用 pattern 参 数 ， 只 是 国定 地 清除 空格 、 制 表 符 和 换行 从 。 
Rust 捉 供 了 trim_matches 系 列 方法 文 持 pattern 参 数 ， 可 以 指定 目 定义 的 删 
除 规则 ， 如 代码 清单 8-24 所 示 。 

代码 清单 8-24:，trim_matches 系 列 方法 使 用 示例 


1 fn main() { 

2 assert eq! ("Hello\tworld\t".trim matches('\t'), "Helloworld") ; 
3 assert eg! ("lltoolbarl |” strim matenes("l'), "Toolbar"; 

4 assert. 6d! ("l22toolbarizs” 

Di „trim Matches (char<iis numeric), "fLoolbar") ; 

6 let x: &lehar|] = @['L*, "2']; 

7 assert eq! ("lZfoolbarl2".trim matches(x), 00lbar ); 

8 

9 


assert, ec: | 

. Wiftoeolbarxx"”.trim matehes(|(¢| è == "1' || € == "X'), 
10. "foolbar" 
Ll; ) ; 
12. assert eg! ("litedlbarli".trim Lert matehes('i")]y "TOOMA"; 
L3. assert Egi 
14. "l123foolbarl23".trim left matehes (chars:is numeric), 
133 "foolbarl23") ; 
16. Let BE gE] = g'i ta 
Lads assert eq! ("lzfodlbarl2” trim lett matenes(x), “Toolbarl2™) ; 
18. assert eq! \ 
14s TO :brim tight matense(|¢] @ =s 1 [| e = Xs 
20. "Legg" 
el. ) ; 
an 


在 代码 清单 8-24 中 使 用 了 trim_matches 系 列 方法 ， 与 trim 系 列 方法 不 
同 的 是 ， 该 系列 方法 可 以 接收 pattern 参 数 。 通 过 传递 pattern 参 数 可 以 自 
定义 需要 删除 的 字符 。 

代码 第 2 一 11 行 ， 展 示 了 trim_matches 接 收 各 种 类 型 的 pattern 人 参数 ， 
最 后 删除 了 字符 串 两 头 相 匹配 的 字符 。 

代码 第 12 一 21 行 ， 展 示 了 trim_left_matches 和 trim_right_matches 方 
法 ， 分 别 用 于 删除 字符 串 左 边 和 右边 相 匹配 的 字符 。 

BAA TL HE 

使 用 trim_matches 系 列 方法 可 以 满足 基本 的 字符 串 删 除 匹 配 需 求 ， 
但 是 其 只 能 去 除 字 人 符 串 两 头 的 字 人 符 ， 无 法 去 除 字符 串 内 部 包含 的 字符 。 
可 以 通过 replace 系 列 方法 来 实现 此 需求 ， 如 代码 清单 8-25 所 示 。 


代码 清单 8-25: replace 系列 方 法 使 用 示例 


1. fn main() { 

2 let s = "Hello\tworld\t"; 

5 assert eq! ("Hello world ", s.replace("\t", " ")); 

4. assert eq! ("Hello world", s.replace("\t", " ").trim()); 

7A Let 6&8 = "EMIS Ls old eld 1237; 

6 assert eq! ("this 1s new new 123", s.replace("old", "new")); 
7 assert eq! ("Chis 18 new old 123"; s.replacen("ola”", “new", 1)); 
8 assert eq! ("this 18 ald ald 125", Breplacen (Oy "a", 3)); 
Ds assert eq! | 

LQ ， "chis 19 old old. newZz3s", 

Lbs s.replacen(char::1s numeric, "new", 1) 

12. E 

LB i] 


在 代 人 码 清单 8-25 中 ， 人 代码 第 3 行使 用 空格 普 换 了 制 表 符 ， 虽 然 满 足 
了 需求 ， 但 是 在 字符 串 结 尾 叉 多 了 衬 格 ， 所 以 ， 这 里 其 实 再 配合 使 用 一 
次 frim 方 法 即 可 ， 如 代码 第 4 行 所 示 。 

replace 方 法 也 文 持 pattern 参 数 ， 默 认 从 左 到 右 将 所 有 匹配 到 的 字符 
符 换 为 指定 字符 。 与 之 相对 应 的 replacen 方 法 ， 文 持 通 过 第 三 个 参数 来 
目 定 符 换 字符 的 个 数 ， 如 代码 第 7 一 12 行 所 示 。 

字符 串 匹 配 模式 原理 

Rust 提 供 的 这 些 字 和 人 符 串 罗 配方 法 看 似 繁多 ， 但 实际 上 其 背后 是 一 僚 
统一 的 迭代 器 适配器 。 我 们 从 matches 方 法 说 起 ， 代 码 清 单 8-26 展 示 了 
matches 方 法 的 源 人 码 。 
代 公 清单 8-26: matches FI RAG 
fn matches<'a, P: Pattern<'a>>(&'a self, pat: P) => Matches<'a, P> 
{ 


Matches (MatchesInternal (pat.into searcher (self) ) ) 


= Co b> H 


} 

在 代 公 清单 8-26 中 ，matches 方 法 返回 的 古 Matches 二 a，P 放 类 
型 ， 它 是 一 个 结构 体 ， 也 是 一 个 达 代 右 。 其 源码 如 代码 清 蛙 8-27 所 示 。 
代码 清单 8-27:，， Matches 夫 代 器 源码 


struct MatchesInternal<'a, P: Pattern<'a>>(P::Searcher) ; 
pub struct Matches<'a, P: Pattern<'a>>(MatchesInternal<'a, P>); 
inpl<"a,y Pi Pattern< a Iterator Tor Marches<'a, D 4 
type Item = &'a str; 
fn next (&mut self) -> Option<é'a str> { 
self.Q.next () 


CO al CF} Ch ce CoO BD f 


} 
在 代码 清单 8-27 中 展示 的 是 部 分 源码 ， 其 中 第 2 一 7 行 实际 上 是 通过 
generate_pattern_ iterators! 宏 生成 的 代码 。 

Matches 结 构 体 是 一 个 元 组 结构 体 ， 也 束 是 NewType 模 式 ， 它 包 汇 
了 MatchesInternal 结 构 体 。 代 人 码 第 3 一 7 行 ， 为 Matches 实 现 了 Iterator， 它 
WLM AI Tas. Eneti F, E XWH J MatchesInternal2# #4 (4 Hy) next 
方法 ， 如 代码 第 6 行 所 示 。 
代码 清单 8-28 展 示 了 MatchesInternal 实 现 next 和 next _ back 方法 的 源 


AS 
代码 清单 8-28: MatchesInternal 实 现 next 和 next _ back 方法 的 源码 
1. impl<'a, Pè Pattern<'a>> MatchesInternal<'a, B> { 
Ea in next-(tmut seli) => ptione" a stxr> 4 
Fa SEl1T.0.NSRE maten() «map(| (ay 6) | unsate 4 
4.. SElT.0.Havystack() -ALICE tnheheekedia,y &) 
J.» }) 
Ga } 
Ts fn next back(émut self) => Option<&"a stro 
8. where P::Searcher: ReverseSearcher<'a> 
hs { 
LQ, sell .0.next matoh back(}).map(| (a, b) | unsate 1 
Lae seltT.0.naystack() .Blice unchecked la; 5) 
Le x F) 
Iaa } 
Ie 3 


MatchesInternal 也 是 一 个 NewType 模式 的 结构 体 ， 它 包装 了 P: 


Searcher. #24! next 和 next_back 方 法 内 部 分 别 调用 了 P: : Searcher 的 
next_match 和 next_match_back 方 法 ， 最 终 返 回 Map 友 代 需 供 将 来 collect 
使 用 。 

Matches 迭 代 需 适 配 圳 工作 示意 图 如 图 8-4 所 示 。 


struct Matches( Matcheslnternal ) 


struct Matcheslnternal( P::Searcher ) 


next —— Matches 


i 


next + Matchesinternal 


| 


next match -一 P::Searcher 





图 8-4: Matches (Cas ta Ac at CES Al 
在 上 面 代码 中 ， 值 得 注意 的 是 Pattern<”′a> ， 该 trait 实 际 上 是 字符 
串 匹 配 算法 的 抽象 。 人 代码 清单 8-29 展 示 了 Pattern<′a> 和 SearchStep 的 
代码 清单 8-29:， Pattern<' a> 和 SearchStep 定 义 
pub enum SearchStep { 
2 Match (usize, usize), 
cr Reject (usize, usize), 
4 


Done 


2， } 

6. pub trait Pattern<'a>: Sized { 

Ts type Searcher: Searcher<'a>; 

8 ffi into Searcher(Selt, haystack: k'a Sir) -> Self; Searcher, 
9 


fi 16 Contained 10 (seit, haystack? p'a Str) -> bool 4 


1D, self.into searcher (haystack) next match().1s_some() 
Ly } 

12. fi 18 prefix af (self; Naystack: e'a str) -> bool { 

Lo. match self.into searcher (haystack) .next() 1 

L4. searchStep::Match(0, ) => true, 

Lös _ => false, 

16. } 

kp } 

18. fn is suffix of (self, haystack: &'a str) -> bool 

Los where SelfisSearchers Reversessarcher< a> 

20. { 

Ad. match self.inte searcher (haystack).next back() { 

Le. searchStep: :Match( , J) 1f haystack.len() == J] => true, 
ADs _ => false, 

24. } 

ia } 

20» | 


ER 8-29}, Patten<!’ a> 包 含 了 一 个 关联 类 型 和 四 个 方 
法 。 天 联 关 型 为 Searcher， 表 示 一 个 可 以 通过 into_searcher 方 法 得 到 的 有 具 
体 搜 索 类 型 ， 并 用 访 搜 索 类 型 必须 实现 另 一 个 Searcher< ”a>trait。 
into_searcher 方 法 中 haystack 人 参数 的 命名 来 自 莫 语 倡 语 “find a needle in a 
haystack”， 意 思 为 “大 海 护 针 ”， 所 以 在 一 般 的 字符 串 罗 配 算 法 中 ， 通 和 
用 haystack “表示 竺 匹配 的 原 字 符 串 ，needle ”代表 子囊 。 比 如 用 子 
He “nana” KVL ACA FF “banana”, JKA “banana” ii zehaystack, “nana” xè 
yeneedle. PUA, EHAN S FHI TT (HE, AH “haystack4” Fl “needle 
RAD DTA EN] © 

SearchStep 是 一 个 枚 举 类 型 ， 其 中 Match Cusize, usize) 代表 匹配 到 
的 字符 索引 位 置 范围 ， 比 如 haystack[0..3]，Reject Cusize, usize) 代表 


未 匹配 的 索引 范围 ，Done 则 代表 匹配 完毕 。 


is contained_in 方法 用 于 判断 needle Pe BAATL haystack $ F. 
is_prefix_of #llis_suffix_of T ENT A Re HARA a A. OR AAR K MP TIF 
串 匹 配 算法 ， 则 会 比较 敏感 ， 前 绥 是 指 除 最 后 一 个 字符 以 外 的 其 余 字符 
的 组 合 ， 后 级 是 指 除 第 一 个 字符 以 外 的 全 部 尾部 字符 的 组 合 ， 如 代码 第 
14 行 和 第 22 行 匹配 的 索引 所 示 。 

在 KMP 算 法 中 ， 前 绥 和 后 缀 用 于 产生 部 分 匹配 表 ， 而 在 Rust 中 这 里 
使 用 的 字符 匹配 算法 并 非 KMP， 而 是 它 的 变种 双 同 〈Two-Way) 字符 
ULAR ， 该 算法 的 优势 在 于 拥有 常量 级 的 空间 复 林 上 度 。 它 和 KMP 
的 共同 点 在 于 其 时 间 复 杂 度 也 是 O”(n ) ， 并 且 都 用 到 了 前 级 和 后 绥 的 
概念 。 

代码 清早 8-30 展 示 了 Searcher 三 ′a 请 的 源码 。 

代码 清 日 8-30: Searcher<’ a> yng 
pub unsafe trait Searcher<'a> { 

Z fn haystack(&selt) -> &'a str; 
Sy fn next (&mut self) -> SearchStep; 
4 


in Next. måtchi(cmut Bel) -> Oplion< (Us126; USize)> 1 


5 loop { 

6 match self.next() { 

Ty searchStep::Match(a, bD) => return Some((a, b)), 
8 searchStep::Done => return None, 

9. _ =P Continue, 

L0 } 

iim } 

12% } 

LS fñ next reject (čmút self) -> Option< (size, isize)> { 

14. Loep 4 

155 match self.next() { 

Les SearchStep::Reject(a, b) => return Some((a, b)), 
ine searchStep::Done => return None, 

18. _ => continue, 

19. } 

ZU « } 

ok is } 

eee | 


代码 清单 8-30 中 的 Searcher<′a> 有 点 类 似 于 迭代 器 ， 其 中 包含 了 
四 个 方法 。 代 码 第 2 行 的 haystack 方 法 用 于 传递 haystack 串 。 

代码 第 3 行 的 next 方 法 用 于 返回 SearchStep。 比 如 needle 串 为 “aaaa”， 
haystack 串 为 “cbaaaaab”， 则 通过 next 方 法 可 以 得 到 “[Reject (0, 1) ， 
Reject (1, 2) , Match (2, 5) , Reject (5, 8) P- 

代码 第 4 一 21 行 ， 分 别 实现 了 next_match 和 next_reject， 用 于 匹配 
SearchStep 来 返回 最 终 匹 配 或 未 匹配 的 索引 学 围 。 注 意 ， 索 引 范 围 为 
Option< Cusize, usize) 之 类 型 。 

代码 清单 8-31 展 示 了 为 &/ a str 类 型 实现 Pattern 二 ”a 这 的 源码 。 

代码 清单 8-31: 为 && a str 类 型 实现 Pattern 二 ”a 放 的 源码 


impl<'a, “b> Pattern<"e> for &'b str 1 
type Searcher = StrSearcher<'a, 'b>; 
fi into searcher (self, haystack: &'a str) 
{ 
StrSearcher: :new (haystack, self) 
} 
fn is prefix of (self, haystack: & a str) 
haystack.1s char boundary(self..ten () ) 
self == éhaystack[..self.len() ] 
fn is suffix of (self; haystack; & a str) 
self.len() <= haystack.len() && 
haystack.1is char boundary (haystack. 
self == é&haystack[haystack.len() - 


. Pub Struct Straearcher<'a, “b> | 


haystack: &'a str, 
needle: &'b str, 


searcher: StrSearcherImpl, 


-> StrSearcher<'a, 'b> 


-> bool 1 


-> bool { 


len() - self.len()) && 
seit. Leni() «« | 


:3 T 
22. enum StrSearcherImpl { 


RS a Empty (EmptyNeedle), 

24. TwoWay (TwoWaySearcher), 

ZB | 

26. unsafe impl<'a, b> Searcher<'a> for StrSearcher<'a, b> 1 
car fn haystack(&self) -> &'a str { 

29 a self.haystack 

29. } 

SU « fn next(&mut self) -> SearchStep { 

Bl y match self.searcher { 

Bes SstrSearcherImpl::Empty(ref mut searcher) => {...} 
35. strSearcherImpl::TwoWay(ref mut searcher) => {...} 
34. } 

Cer } 

30% fn next match(&mut self) -> Option<(usize, usize)> { 

is match self.searcher { 

38 . StrSearcherImpl::Empty(..) => {...} 

5 StrSearcherImpl::TwoWay(ref mut searcher) => {...} 
40. } 

41. } 

42. } 


仔细 看 代码 清单 8-31 所 示 的 代码 结构 ， 友 现 into_searcher 生 成 用 于 
PUAC&’ a str 类 型 字符 串 的 搜索 类 型 为 StrSearcher 二 a, ' b>, Exe 
个 结构 体 ， 包 含 了 三 个 字段 ， 其 中 haystack 和 needle 分 别 表示 haystack 捉 
和 needle 串 ， 人 而 searcher 是 一 个 StrSearcherImpl 枚 举 体 。 

StrSearcherImpl 枚 举 体 包含 的 两 个 变 体 Empty (EmptyNeedle) 和 
TwoWay (TwoWaySearcher) ， 分 别 代表 处 理 空 字符 串 和 非 空 字符 串 两 
种 情况 。 当 处 理 衬 字符 串 时 ， 实 际 使 用 EmptyNeedle 来 处 理 ， 当 人 处理 非 
空 字符 串 时 ， 实 际 使 用 TwowaySearcher 来 处 理 。 其 中 TwowWaySearch 吏 
是 双 回 字符 串 匹 配 算 法 的 其 体 实 现 。 

以 上 吏 是 字符 串 匹 配 算法 的 育 后 机 制 ， 使 用 Pattern< a > 、 
Searcher<’ a > 和 SearchSstep 来 抽象 字符 串 匹 配 算法 , PAIR AAU 


代 器 模式 进行 检索 。 同 样 ， 这 里 也 是 Rust 一 致 性 的 体现 。 
8.1.7 与 其 他 类 型 相互 转换 


在 日 间 开 有 发 中 ， 字 符 串 和 其 他 次 型 的 转换 是 很 第 见 的 需求 。Rust 也 
提供 了 一 些 方法 来 帮助 开 及 者 方便 地 完成 这 类 转换 。 

将 字符 串 转 换 为 其 他 类 型 

可 以 通过 std: : str 模 块 中 提供 的 parse 泛 型 方法 来 将 字符 串 转 换 为 
指定 的 美 型 ， 如 代码 清单 8-32 所 示 。 

代码 清单 8-32: parse 方 法 使 用 示例 


le £ maing) i 

2 let four: u32 = "4" .parse().unwrap(); 
Be assert eq! (4, four); 

4 let four = "4" parse i t<us2z>() + 

3 assert eqi(Ok(4), four); 


6. } 

在 代码 清单 8-32 中 ， 使 用 parse 方 法 将 字符 串 " 4" 转换 为 u32 关 型 。 
因为 parse 为 泛 型 方法 ， 所 以 也 可 以 使 用 turobfish 操 作 符 为 其 指定 次 型 ， 
如 代码 第 4 行 所 示 。 

其 实 parse 方 法 内 部 是 使 用 FromStr: : from_str 方 法 来 实现 转换 的 。 
FromSstr 是 一 个 trait， 其 命名 符合 Rust 的 一 致 性 惯例 ， 代 人 码 清 单 8-33 展 示 
了 该 trait 的 定义 。 

代码 清单 8-33: FromStr 定义 

1 DUD EFALE FEOMSED f 

2 type Err; 

Sa fn from Str (s: S6tr) => RepultcSelir selis Err»; 
4. } 

从 代码 清单 8-33 中 可 以 看 出 ， 在 FromStr 中 定义 了 一 个 from_str 方 
法 ， 实 现 了 此 trait 的 类 型 ， 可 以 通过 from_str 将 字符 串 转 换 为 该 类 型 。 返 
回 值 为 一 个 Result 关 型 ， 访 类 型 会 在 解析 失败 时 返回 Err. Rust 为 一 些 基 
本 的 原生 类 型 、 布 尔 类 型 以 及 P 地 址 等 少数 类 型 实现 了 FromStr， 对 于 
目 定 义 的 类 型 需要 目 己 手工 实现 ， 如 代码 清单 8-34 所 示 。 


代码 清单 8-34: 为 日 定义 结构 体 实现 FromStr 


Le Mae Stdsistrs sroOmMtes 

2. use std::num::ParseIntError; 

3. #[derive (Debug, Partialkq) ] 

A, struct Point { 

Die ee Laz, 

Sy ye £32 

Te J 

8. impl FromStr for Point 1 

9. type Err = ParseIntError; 

此 由 fn from str(s: &str) => Result<Self, SelftsErr> | 
Ii, let Coerds = Betrim matehest( (pl pa "4 || p =s | 
Les 了 

L3. .collect: :<Vec<é&str>>(); 

1A let. x fromstr = coords[0].parse::<i32>() ?; 
LS s let y fromstr = coords (1) sparse: s<132>4) 27 
16. OK (POLIT 1 By & Ironstr, y: y Tromstr F) 

im } 

LBs: J 

Les, T0 mee ti) 4 

Zs let p = Point: from Str(" {1;2}") 

21. assert eq! (p.unwrap(), Point{ x: 1, y: 2} ); 
Ze s let p = Point::frem str("{3,u}"); 

235 // Err(ParseIntError { kind: InvalidDigit }) 
24. OLINE: "is: r DS 

9a 1 


在 代码 清单 8-34 中 ， 实 现 了 将 特定 格式 的 字符 串 转 换 为 Point 结 构 体 
类 型 。 代 码 很 简单 ， 重 点 在 于 第 11 一 16 行 ， 通 过 trim_matches 将 字符 串 
两 头 的 花 括 号 去 反 ， 然 后 使 用 split 将 字符 串 按 去 号 分 割 为 包含 两 个 字符 
PHJ Vec 二 &str 二 > 数组， 再 分 别 通 过 索引 将 其 解析 为 数字 ， 最 后 构造 为 
Point 结 构 体 的 实例 并 人 返回 相应 的 Result 类 型 。 

如 果 是 不 满足 特定 格式 的 字符 串 ， 则 会 返回 对 应 的 错误 类 型 ， 比 如 
代码 第 22 行 ， 最 终 得 到 有 的 结果 是 Err (ParseIntError{kind: 


InvalidDigit}) 错误 类 型 。 
将 其 他 闫 开园 换 为 字符 是 
如 琳 想 把 其 他 类 型 转换 为 字符 串 ， 则 可 以 使 用 format! 安 。 
format! %&println! 及 write! 宏 类 似 ， 同 样 可 以 通过 格式 化 规则 来 生 
成 String 类 型 的 字符 串 ， 如 代码 清单 8-35 所 示 。 
代码 清单 8-35: 使 用 format! 根据 字符 串 生 成 字符 串 
fn main() { 
let s: String = format! ("{ Rust"; “Hello"); 
assert eq: (Ss “Hellokust"); 


i 

2 

5 

4 assert EG! (Tormat! (™ ES) "He lORUst J) “HelloRust™) 7 
Dis assert, eq! (format! [13.3 F"; "“HelloRiust™), “Hel “jj 
6 

7 

8 

9 


( 
( ‘hme 
assert eq! (format! ("{:10}", “HelloRust"), "HelloRust ") ; 
assert eq! (Tormat!( Sela “HelloRusr”),» "“Hellokust “I? 
assert. €91 (Tormat! (H EFLA jp “HElLlGRGSt”),; T HelloRust™) 7 
assert eq! (Tormat! (H In"; “HelloRust”), M HelleRust. "Jj 
10 assert eq! (format! ("{s*lZ.5}", “HelloRust”), " Hello ae 
11 assert eq! (format! ("i s=*1l2so)", “HelloRust"), “===Hello====") 7 
12 Lt E0. (TOAT: (rer l2.gh"», “HEllORUSt")», ENELLO MT) 
LS. assert eq! (format! ("{:5}", "th\u{e9}"), "the "Y? 
14. } 


代码 清单 8-35 展 示 了 format! 格式 化 示例 ， 格 式 化 效果 如 图 8-5 所 
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图 8-5: format! 格式 化 效果 

基本 有 的 格式 化 规则 可 以 忌 结 为 下 面 三 条 : 

ATIE HERE o IN: number}, number nary. UW 
代码 清单 8-35 中 第 4 行 所 示 。 如 果 number 的 长 度 小 于 字符 串 长 度 ， 则 什 
么 部 不 做 ;如 果 number 的 长 上 度 大 于 字符 串 的 长 上 度 ， 则 会 默认 填充 空格 来 
扩展 字符 串 的 长 上 度 ， 如 代码 第 6 行 所 示 。 

截取 字符 串 。 格 式 为 {: .number}， 注 意 number 前 耐 有 从 号“.”， 
number 代 表 要 截取 的 字符 长 上 度 ， 也 可 以 和 填充 格式 配合 使 用 ， 如 代码 清 
单 8-35 中 第 5 行 所 示 。 

对 齐 字 人 符 串 。”。 和 格式 为 {: >h {: AM: <} 分布 表 示 左 对 
齐 、 位 于 中 间 和 右 对 齐 。 如 代码 清单 8-35 中 第 7 一 10 行 所 示 ， 也 可 以 与 
其 他 格式 代码 配合 使 用 。 

在 代码 清单 8-35 中 ， 代 码 第 11 行 和 第 12 行 ， 直 接 在 冒号 后 面 使 
用 “=” 和 “#*>” 蔡 代 默 认 的 空格 填充 。format! 格式 化 字符 串 是 按 字 符 来 处 
理 的 ， 如 代码 第 13 行 所 示 ， 不 管 字 符 串 多 长 ， 对 于 里 面 的 Unicode 码 位 
都 会 以 单个 字符 位 来 处 理 。 


除 满 足 上 述 格式 化 规则 之 外 ，Rust 还 提供 了 专门 针对 整数 和 浮 点 数 
的 格式 化 人 代码。 代码 清单 8-36 展 示 了 针对 整数 的 format! 格式 化 示例 。 
代码 清单 8-36: 针对 整数 使 用 format! 格式 化 为 字符 串 


1. fn main() { 
Ae assert eq! (format! ("{er}", bod3d})s "FL234" y; 
3 assert eq! (rormar! ("LITR y L200 "TAAL" 
4, assert. eq! (format! (itf "y 1234), "+0xdd2")} 
Do asseet eqi (IOME [iB]; 1238]; “LOULLOLUULOM YS 
Ga assert eq! (format! ("{vfb}]"; 1234), "0b10011010010"); 
Ty assert eg! (tormar! ("4 s720b}", 1234y ” QR LO Loto Le ys 
8. assert eq! (lormac! (TAFOD; >) 1254), "UBIO0L1O0LO0010 Me 
9. Assert SG! (fermac! [M Inom; 1234), T  ObLOOLLOLOOLO 8 
LO assert eq! (format! ("wot Loui "Es 1234]; ” +0x4d2"); 
ite e assert eq! (formar! ("1> t FOLEX] "; 1234); "HOR00000000048d2") ; 
i Pe, 

在 代码 清单 8-36 中 ， 除 使 用 上 面 介 绍 的 格式 化 代码 之 外 ， 还 用 到 了 
ETT AE BE EN AA CUTS AZ P: 

:符号 + ， 表 示 强 制 输出 整数 的 正人 负 人 符号 。 


HSH ， 用 于 显示 进 制 的 前 级 。 比 如 十 六 进 制 显示 0x， 二 进 制 显 


示 0b。 
` 数字 0 ， 用 于 把 默认 填充 


的 空格 普 换 为 数 子 0。 


为 了 便于 理解 ， 图 8-6 展 示 了 针对 整数 的 format! 格式 化 规则 。 


aja} sia) | | tf 
9 
+|12ls3l4| | | | 
9 
em | || | +l12|3|4 
9 


œ | | | | |+lajal]2 
9 | 

ew | | | | |o|x|4|dl2 
| 9 | 


pm [+]o]x]o]o [olala] 
9 : 


图 8-6: 针对 整数 的 format! 格式 化 规则 
针对 浮 点 数 ， 茶 些 格 却 化 代 人 码 又 表示 不 同 的 侣 义 ， 如 代码 请 单 8-37 
所 示 。 
代码 清单 8-37: EFAN A ZUE H format! 格式 化 为 字 和 从 上品 





Le Fi main{)y 

Ra assert eq! (format! ("{r.4)", 1254.36/8), "1234:5078" )3 

co assert eq! (format! ( (sed s 12943618), “l2sed.56") 7 

4, assert SO (Ormar: (MHT ar Lesa. Gl TILI 

Ja assert eg! (format! [M ISIU. 4"; 123a a]; TIZM a00 T] i 

6. assert. eq) (format! ("Ss L222} rn l2gd«9618), 7 L43430 "Jj 
Ta ASHert Egi (formar! ("iruna y lasde5b/o), “UO0l234.5/000") ; 
:二 Assert egi (IOn: te] 1229.907 TACE T 

Ba f 


F FA BURR AGE BATE AB PA: 


+ fa xe DBUR Ja HY A BOM o 


APs. NR eT EE BUD BUR Ja AY 


有 效 位 。 这 里 需要 注意 的 是 ， 在 指定 有 效 位 时 会 四 售 五 入 ， 如 代码 清单 


8-37 中 第 3 行 和 第 4 行 所 示 。 


“ 科学 计数 法 。 使 用 {: e} 可 以 将 浮 后 数 格式 化 为 科学 计数 法 的 表示 


形式 。 


图 8-7 展 示 了 人 针对 浮 点 数 的 format! 格式 化 规则 。 


213|14|.|15|6|7|18 
9 
1f2 3/4) .|si6 
: 7 « 


了 12|3|14|.15|6|7|s|olo 
11 


2|3|4|.15|e| | | 
10 
wog |1|2|3|14|.15|6lolololo 
7 10 
com |1 .12|3|4|5|6|7|sle|a 
10 ss 


图 8-7: 针对 浮 点 数 的 format! 格式 化 规则 
以 上 所 有 的 格式 化 规则 ， 对 printIn! 和 write! 宏 均 适用 。 前 面 展示 
的 都 是 字符 串 、 整 数 和 浮 点 数 等 内 置 类 型 的 格式 化 ， 如 果 要 对 目 定 义 类 
型 格式 化 ， 则 需要 实现 Display trait， 如 代码 清单 8-38 所 示 。 
代码 清单 8-38: 对 目 定 义 类 型 format! 格式 化 为 字符 串 


l1. use std::fmt::{self, Formatter, Display}; 





2 struct City | 
Jy name: &'static str, 
4 late T322; 
5 Lom: E22, 


Oe J 

Ye ampl Bisplay Bor City | 

8 fn fmt(é&self, fy &mut Formatter) => fmt::Result | 

9 EE lal @ BELL 7 Wu 4 E J BELE i Se J 


ia let Len © = LE gorr. igh 2= 0.0 4 IET T eles f Wi J 

‘mt g wurbel (ft, "hs fread) TF teed) TE", 

12, selfename; SolT latas lr lat c; self, Joao (ty lon ¢) 
L33 } 

een “af 


15,» fn maim) 4 
16. let city = City { names “Beijing”, lat: 39.90469, lon: -116.,40717 J}; 


LAS assert, Sq! (format! ("i }", City), "BEljing: 39.905°N 116.407°W") ; 
LB. BELELELR! (STE, ELEV]? 
Ly. d 


在 代码 清单 8-38 中 ， 为 结构 体 City 实 现 了 Display trait， 所 以 可 以 通 
过 format! 宏 根据 结构 体 实例 city 生 成 相应 的 字符 串 ， 如 代码 第 17 行 所 
不 。 


8.1.8 回顾 


关于 字符 串 的 介绍 ， 到 此 告 一 段落 。 现 在 用 一 个 小 例子 来 回顾 一 下 
之 有 鲁 讲 过 的 内 容 。 如 图 8-8 所 示 ， 有 一 个 数字 方 阵 ， 求 出 其 对 角 线 位 置 
的 所 有 数字 之 和 。 


1+6+/7+1 
+4+7+8+4 





图 8-8: 求 数字 方 阵 对 角 线 位 置 的 数字 之 和 
使 用 原生 字符 串 声 明 语法 O"... "O 将 此 数字 方 阵 定义 为 字符 串 ， 
然后 按 行 届 历 其 字符 即 可 得 到 结 末 ， 如 代码 清单 8-39 所 示 。 
代码 清单 8-39: 求 数 字 方 阵 的 对 角 线 数字 之 和 


Le «=i WL 

Bs let s = r"1234 

cP 5678 

4. 9876 

Bia 4321"; 

Cis let (mut x, mut y) = (0, OQ); 

Ta for (idx, val) in s.lines().enumerate() { 

8. let val = val.trim(); 

9. let left = val.get(idx..idx+1) 

10. unwrap () .parse: :<u3Z>() .unwrap'() ; 
ie let right = val.get((3 = idx)..(3 = idx+tl1)) 

LA « -unwrap().parse::<u32>().unwrap(); 
Le a x += left; 

14. y += right; 

15. } 

LS. assert equities, sty); 


在 代码 清单 8-39 中 ， 代 码 第 2~5 行 ， 使 用 原生 字符 串 声 明 语 法 (r 
"'..." ) 将 数字 方 阵 定义 为 字符 串 。 该 语法 的 好 处 是 ， 可 以 保留 原来 字 
从 串 中 的 特殊 从 号。 

代码 第 6 行 ， 声 明 两 个 整数 变量 用 于 记录 两 条 对 角 线 上 的 数字 之 
和 ， 最 终 将 这 两 个 变量 加 起 米 束 得 到 所 求 结 

代码 第 7 一 15 行 ， 使 用 for 循 坏 达 代 数字 方 阵 字 人 符 串 的 每 一 行 来 获取 
对 角 线 上 的 数字 进行 累加 求 和 。 其 中 使 用 了 字符 串 的 lines 方法 ， 可 以 
目 动 按 换 行 从 达 代 字符 串 ， 然 后 使 用 了 了 enumerate 方法 来 获取 行 号 索引 。 

代码 第 8 行 ， 在 for 循 环 中 使 用 trim 方 法 将 每 一 行 的 子 字符 串 两 头 多 
余 的 空格 删除 。 

代码 第 9 行 和 第 10 行 ， 使 用 get 方 法 结合 范围 参数 来 获取 相关 位 置 的 
字符 。 这 里 使 用 了 一 个 技巧 ， 斜 线 对 角 线 位 置 字符 的 索引 正好 等 于 循环 
行 号 索引 。 获 取 到 相应 位 置 的 字符 ， 需 要 用 parser 方 法 将 该 字符 转换 为 
u32 类 型 。 

代码 第 11 行 和 第 12 行 ， 使 用 get 方 法 获取 反 和 斜 线 对 角 线 位 置 的 字 
伯 ， 而 该 对 角 线 上 的 字符 位 置 索 引 正好 和 循环 行 写 索 引 相 反 ， 所 以 这 里 
使 用 了 为 一 个 技巧 ， 使 用 3 减 去 人 循环 行 吨 索引 束 得 到 相应 对 角 线 上 的 位 
置 。 

第 13 行 和 第 14 行 ， 分 别 累加 两 条 对 角 线 上 的 字符 值 之 和 。 代 码 第 16 
行 ， 分 别 将 两 条 对 角 线 上 的 数字 之 和 相 加 ， 即 可 得 到 最 终结 果 38。 

随 书 源码 中 也 给 出 了 其 他 实现 方法 。 


8.2 集合 类 型 


Rust 标 准 库 中 提供 的 集合 类 型 包括 以 下 几 种 : 

“Vecx<T> ， 动 态 可 增长 数组 。 

-VecDeque<T> ， 基 于 坏 形 缕 冲 区 的 先进 先 出 FIFO》 双 闹 队列 
实现 。 

-LinkedList<T> ， 双 向 链表 实现 。 

-BinaryHeap<T> , — HE Cae KE) 实现 ， 可 用 作 优 先 队 列 。 

-HashMap<K, V> ， 基 于 哈 硕 表 的 无 序 K-V 了 映射 集 实现 。 

BTreeMap<K, V> ， 基 于 B 树 的 有 序 映 射 集 实现 ， 按 Key 排 

序 。 

-HashSet<T> ， 无 序 集合 实现 。 

-BTreeSet<T> ， 基 于 B 树 的 有 序 集合 实现 。 

以 上 最 常用 的 集合 类 型 为 Vec<T>> 和 HashMap<K，V>， 接 下 来 
主要 介绍 这 两 种 集合 类 型 。 


8.2.1 动态 可 增长 数组 


Rust 中 数组 有 两 种 类 型 : 一 种 是 原生 类 型 array， 它 拥有 固定 的 长 
E, RASAAIT; N; 另 一 种 是 动态 可 增长 数组 Vector， 它 是 可 增长 
的 动态 数组 ， 类 型 签名 为 Vec<T> ， 在 运行 时 才 可 知道 大 小 。 在 第 4 章 
中 已 经 介绍 过 ，array 和 Vector 的 区 列 在 于 ，array 中 的 元 系 可 以 在 栈 上 存 
fig; ， 而 Vector 中 的 元 系 只 能 在 堆 上 分 配 。 本 半 大 香 介绍 动态 可 增长 数组 
Vector. 

基本 操作 与 内 存 分 配 

创建 Vector 和 创建 String 类 型 字符 串 的 方法 很 相似 ， 因 为 String 类 型 
的 字符 串 本 里 就 是 对 Vec 二 8 二 类 型 的 包装 。 代 码 清 日 8-40 展 示 了 Vector 
的 基本 操作 。 

代码 清单 8-40: Vector 基本 操作 


lL. £8 taan | 

Lis let mut. vee = Veco: snew'() 7 

Ss VEC BUusl (1); 

4. vec.push (2) ; 

Sa assert eg! (vec.lén(), 2) 7 

6. assert ‘eq! {(vec[U]y 1); 

Ta assert eq! (vec.pop(), Some (2) J} 

Bi. rt eqiivec.len(), 1) 7 

> vea[0] = 7; 

LQ. assert eq! (vec([0O], 7) % 

Lla assert eq! (vec.get(0), Some(é/)); 

12. AS6ErC So (VES gE (10) None) yg 

L3. // wec[10] 

14. vec.extend([1, 2, 3] .1tver() -cloned()),; 
LD assert eg! (VES ly dy 2r l)? 

los rt ggi (VEC. 0er (0 POENE Iad] Lead NIA 
i = let mut. yed? = vec! (4, 5S, 6]; 

LB 。 vec.append(é&mut vec2); 

18. assert eq! (vec, LTr ly 2y Br 4r Sr 6]); 
20. assert eq! (vecz, [])% 

ZL » vec.swap(l, 3); 

Ze s assert! (vec == [Vy 3 Zr ly Sy Sy Gl) 
Z a let slice = [ly By Sy dr Sy Gy Tl? 

24. vec.copy from slice(é&slice) ; 

Z5. assert Eq! (vec, S1LLOEY } 

26 . let slice = [4, 3, 2, Il]; 

Zh vec.clone Trom slice (éslice) ; 

Za Assert €g: (vec, slice); 

dd, | 


在 代码 清单 8-40 中 ， 代 码 第 2 行 ， 使 用 Vec: : new 方 法 可 以 创建 一 
A&M Vector TAH, String: 


Fo MURR T RBA ACA 
PIIRINI Fa PE at A o 


HHE 


S NTAS 


new 类 似 ， 实 际 上 并 未 分 配 堆 内 
充 元素 ， 则 Rust 编 译 器 会 认定 它 为 未 


代码 第 3 行 和 第 4 行 ， 使 用 push 方 法 插入 数字 类 型 ， 这 里 编 详 右 会 默 
WA TET LR AY 132 

代码 第 5 行 ， 使 用 len 方 法 租 看 vec 的 大 小 为 2， 因 为 已 经 插入 了 两 个 
JUR o 

ASOT, IR l AA VL AICA o 

代码 第 7 行 ， 通 过 pop 方 法 弹出 vec 末 尾 的 元 素 。 可 以 看 出 ，Vector 数 
组 天 生 就 可 以 作为 先进 后 出 (FILO) 的 栈 结构 使 用 。 注 意 pop 方 法 返回 
的 是 Option< 工 > 关 型 ， 当 数组 为 空 时 ， 会 返回 None， 从 而 避免 线程 裔 
沉 。 此 时 使 用 len 方法 奉 看 vec， 其 长 度 已 经 变 为 1， 如 代码 第 8 行 上 所 示 。 

代码 第 9 行 ， 通 过 索引 访问 也 可 以 修改 相应 位 置 的 元 系 ， 这 里 把 索 
引 为 0 的 元 系 改 为 7， 如 代码 第 10 行 所 示 。 

代码 第 11 一 13 行 ， 分 别 使 用 get 方 法 和 索引 对 vec 进 行 越界 访问 。get 
方法 返回 的 是 None， 而 通过 索引 直接 访问 则 会 导致 线程 骨 尝 。 

代码 第 14 行 ， 使 用 extend 方 法 给 vec 数 组 追加 元 素 ， 其 参数 为 一 个 迭 
代 器 。 其 结果 如 代码 第 15 行 所 示 。Vector 数 组 也 支持 欠 代 器 ， 在 本 书 中 
ARREO A EBATE, KENBAAR. 

代码 第 16 行 ， 通 过 给 get 方 法 传 入 索引 范围 ， 可 以 获取 相应 的 数组 
WF o 

代码 第 17 一 20 行 ， 通 过 append 方 法 可 以 给 一 个 Vector 数组 退 加 另 一 
个 数组 ， 其 参数 为 可 变 借 用 ， 如 代码 第 18 行 所 示 。 但 是 这 两 个 Vector 数 
组 都 将 发 和 后 变化， 如 代码 第 19 行 和 第 20 行 所 示 。 

代 但 第 21 行 ， 使 用 swap 方 法 可 以 交换 两 个 指定 索引 位 置 的 元 叉 ， 所 
得 结 末 如 代码 第 22 行 所 示 。 

代码 第 23 行 和 第 24 行 ， 通 过 copy_from_slice 方 法 可 以 使 用 一 个 数组 
切片 将 原 vec 数 组 中 的 元 率 全 部 和 奉 换 ， 如 代码 第 25 行 所 示 。 但 是 注意 ， 
数组 切 户 必须 和 原 数组 等 长 ， 人 否则 会 引用 线程 朋 涡 。 需 要 注意 的 是 ， 充 
方法 只 支持 实现 Copy 语 义 的 元 素 。 

代码 第 26 行 和 第 27 行 ， 使 用 clone_from_slice 方 法 的 效果 和 
copy_from_slice 是 等 价 的 ， 但 它们 的 区 别 是 ，clone_from_slice 方 法 文 持 
实现 Clone 的 类 型 元 素 。 


除了 这 些 方法 ， 还 可 以 使 用 with_capacity 预 分 配 扒 内 存 的 方式 来 创 
建 Vector 数组 ， 如 代码 清单 8-41 所 示 。 
代码 清单 8-41: Vector 推 内 存 预 分 配 示例 


Ls £O ALAT) f 

cae let mut. vec = Vec:swith capacity (10) ;7 
ce fOr 1 TH Ges. lO tvee. push) F! 

4. vec. truncate (0)? 

Fo assert eg! (10, vac.capacity()?)ý 

S's Pom 二 an Ue. dD + westr) sl! 

{a veCstlear()s 

a assert eg! (10, vec..capacity() )? 

hs Véc.8Shrink to. ELE () ; 

LQ assert eq! (0, vee.capacaty ()) 

Lls DOr 1 TH ard A 

Lz vec. DUSO (1) 3 

L3. // output: 4/4/4/4/8/8/8/8/16/16/ 
14. printi O's) Ve capacity); 
Las } 

Loe. J 


在 代码 清单 8-41 中 ， 使 用 了 Vec: : with_capacity 方 法 ， 和 
String: : with_capacity 方 法 类 似 ， 可 以 预 分 配 堆 内 存 。 这 里 分 配 了 容量 
为 10 个 单位 的 堆 内 存 ， 实 际 上 真正 分 配 的 堆 内 存 大 小 等 于 数组 中 元 系 
类 型 所 占 字 节 与 给 定 容 量 值 之 积 。 

代码 第 3 行 ， 通 过 for 循 环 在 vec 数 组 中 插入 数字 0~~9。 数 字 默 认 推 靳 
为 4 字 节 ， 那 么 这 里 预 分 配 的 推 内存 大 小 为 容量 值 10 乘 以 4 字 和 等 于 40 字 
gale 

RIBERA, IEH truncate H EMAR S| OFT aa, «SE ERS fE] 
于 clear 方 法 。 但 是 这 样 只 是 清空 了 元 系 ， 并 未 释放 预 分 配 的 堆 内 存 。 代 
人 第 5 行 显示 vec 容 量 依旧 是 10。 

代码 第 6 一 8 行 ， 使 用 clear 方 法 重复 上 述 过 程 ， 结 果 相 同 ， 预 分 配 的 
HE WN ESE AS BOE DL 

代码 第 9 行 ， 使 用 了 shrink_to_fit 方 法 ， 预 分 配 的 堆 内 存 被 释放 了 了。 


实际 上 ， 访 方法 只 有 在 vec 数 组 中 元 素 极 清空 之 后 才 会 释放 预 分 配 的 堆 
内 存 ， 当 vec 数 组 中 元 系 并 未 占 满 容量 空间 时 ， 束 会 压缩 未 航 使 用 的 那 
部 分 容量 空间 ， 相 当 于 重新 分 配 推 内 存 。 

代码 第 11 一 15 行 ， 对 已 经 伞 杰 放 扒 内 存 的 vec 数 组 ， 重 新 循环 插入 
数字 0 一 9， 通 过 代码 第 14 行 的 输出 结果 可 以 看 出 ， 第 一 次 分 配 了 容量 次 
4， 用 完 以 后 ， 目 动 将 容量 加 a 到 了 8， 答 容量 8 用 尺 之 后 ， 义 目 动 将 容量 
加 到 了 16， 可 见 ， 容 量 是 按 倍 数 如 增 的 。 

所 以 ， 在 日 党 编程 中 ， 使 用 Vec: : with_capacity 方 法 来 创建 Vector 
数组 可 以 有 效 地 避免 频 索 申请 推 内 存 融 来 的 性 能 损耗 。 在 代 但 清单 8-41 
中 用 到 的 类 型 有 基本 大 小 ， 比 如 i32 占 4 字 节 。 但 在 Rust 中 有 些 类 型 是 不 
GAH, IBPEK DRE (ZST) ， 那 么 它 是 怎么 存储 的 呢 ? 对 于 使 
用 Vec: : new 方 法 创建 的 空 数组 ， 如 果 没 有 分 配 推 内存， 那么 它 的 指 
‘ta (AB HA? 代码 清单 8-42 展 示 了 Vector 数组 存储 零 大 小 类 型 示例 。 

代 但 清单 8-42: Vector 数组 存储 零 大 小 类 型 示例 


1 SEPUCE BOG; 

y: fn main() { 

3 let mut vec = Vec::new(); 

4. vec.push (Foo) ; 

5 assert eg! (vec .capacity(), stdi:usize: MAX) ; 
6 } 


在 代码 清单 8-42 中 ， 定 义 了 一 个 单元 结构 体 Foo， 访 结构 体 并 不 占 
用 内 存 ， 属 于 零 大 小 类 型 。 代 码 第 3 行使 用 Vec: : new 初 始 化 了 一 个 
Vector 空 数组 。Vector 数 组 本 质 属于 一 种 智能 指针 ， 跟 String 类 型 的 字 
从 串 一 样 ， 它 也 由 三 部 分 组 成 : 指 问 堆 中 学 市 序列 的 指针 (as_ptr 方 
法 ) 、 记 录 堆 中 字 市 序列 的 字 市 长 上 度 (en 方法 ) 和 扒 分 配 的 容量 
(capacity 方 法 ) 。 因 为 此 时 并 未 预 分 配 堆 内 存 ， 所 以 其 内 部 指针 并 非 
指 同 扒 内 存 ， 但 它 也 不 是 至 指针 ，Rust 在 这 里 做 了 空 指针 优化 。 

代码 第 4 行 ， 使 用 push 方 法 插入 Foo 实 例 〈 单 元 结构 体 的 实例 就 是 它 
目 己 ) ， 因 为 Foo 是 零 大 小 类 型 ， 所 以 也 不 会 预 分 配 推 内存 。 

代码 第 5 行 显示 ， 此 时 vec 的 容量 竟然 等 于 std: : usize: : MAX, 
该 值 代表 usize 关 型 的 最 大 值 。 实 际 上 这 里 是 Rust 内 部 实现 的 一 个 技巧 ， 
用 一 个 实际 不 可 能 分 配 的 最 大 值 来 表示 零 大 小 类 型 的 容量 。 


所 以 ， 我 们 可 以 放心 地 使 用 Vector， 而 不 必 担 心 内 存 分 配 会 


何不 安全 的 问题 。 
得 找 与 排序 


数组 也 支持 字符 串 中 提供 的 一 些 查 找 方法 ， 比 如 contains、 
starts_with 和 ends_with 方 法 ， 如 代码 清单 8-43 上 所 示 。 


代码 清单 8-43: 
Pie 
cm 
4. 
Ss 
i. 
Ty 
Ga 
Ja 
ks 
i 
Le a 
i ad 


contains 等 方法 使 用 示例 
1. fn main() | 
let v= [10, 40, 30]; 


assert! (v contains (£30) ) 2 
assertiv contains (650) ) > 
aseercul (Yatarts Wits oo 


[1 40])); 
01)); 


( 
( 
( 
Cats withe(s 
( [3 
assert! (v.ends with(&[40, 30])); 
( [ | 
& 
( 
( 


assert 
assert (vends with (4 


assert! 


v.ends with (é jja 
[us] = all; 
Vestarts with(&[])); 


v.ends with(é&[])); 


let v: 
assert! 


assert! 


市 来 任 


在 代码 清单 8-43 中 展示 的 contains、starts with 和 ends with 都 是 泛 型 
Ela] AJtraitb Ze : Acer ar ， 充 trait 定 义 了 一 些 


方法 。 它们 有 一 个 共 


方法 用 于 判断 等 价 天 系 ， 本 章 后 面 会 有 评 细 介 


用 类 型 ，starts_with 和 ends_with 接 收 的 是 数组 切片 类 型 。 
除 这 三 个 方法 之 外 ， 标 准 库 中 还 提供 了 binary_search 系 列 汉 型 方法 


来 带 助 开 肥 者 方便 地 检索 数组 中 的 元 系 ， 如 代码 清单 8-44 所 示 。 


代码 清单 8-44: 


binary_search 系 列 泛 型 方法 使 用 示例 


绍 。contains 只 能 接收 引 


L in maing) í 

2 let s = [By dy de fy by By Sy By 6; Lo Bly SH, GS]; 
3 assert eq! (Sswbinary search(&l13), Ok(9)); 

4 assert eq! (S.binary search (&4),  EHrr(y)); 

Bo let £ = S.binary search (&1) ; 

6 assert! (match © (| Ok(1...4) => true, => false, |); 
{ let seek = 13; 

8 assert égi 

9 s.binary search by(|probe| probe.cmp(é&seek)), 


Les Ok (9) 
ot E- 
ls; lèt s = Lt, Ue tas Lie Ts Da Se dir Eee Liy 
13 [iy Zio ten sve te Cy bo, Ci» a. Lal. 
i a fly BL Pes Bie to, Bm] 
19s assert eg; 
Ls s.binary search by key(el3; |&(a,b)| B); 
as 46 Ok (9) 
Lo 4 E- 
Tee 4 

binary_search Fry& COU /E = 4p BRT ERAT IE, SEAS EF 
答 找 的 数组 必须 是 有 序 的 ， 访 算法 的 平均 时 间 复 杂 度 为 O Cogn), F 
间 复 杂 上 度 用 迭代 实现 ， 所 以 是 DO (1) 。 

在 代码 清单 8-44 中 ， 代 码 第 2 一 6 行 展 示 了 binary_search 方 法 ， 其 参 
数 为 一 个 引用 类 型 ， 有 日 该 参数 类 型 必须 实现 Ord。Ord trait 抽 象 了 比较 操 
作 ， 本 章 后 面 会 有 详细 介绍 。 在 本 例 中 ，binary_search 方法 接收 &13 作 
ABA, VE] Result 类 型 的 参数 Ok (9) ， 表 示 其 所 在 索引 为 9 的 位 
置 。 对 于 找 不 到 的 元 素 ， 则 返回 Err。 如 果 要 处 理 Result 类 型 ， 则 可 以 使 
用 match 匹 配 ， 如 代码 6 行 所 示 。 

代码 第 7 一 11 行 展示 了 binary_search_by 方法 ， 访 方法 的 参数 是 一 
个 FnMut (&’ a T) -之 Ordering 闭 包 。Ordering 古 一 个 枚 举 类 型 ， 记 录 
的 是 三 种 比较 结果 : 小 于 (Less) 、 等 于 (Equal) MAF (Greater) 。 
代码 第 9 行 团 包 中 所 用 的 cmp 方 法 是 Ord trait 中 所 定义 的 ， 所 以 该 方法 只 
能 用 于 检索 实现 了 Ord 的 类 型 。binary_search_bvy 方 法 最 终 返 回 的 结果 同 


样 是 Result 类 型 。 

代码 第 12 一 18 行 ，binary_search_by_key 方 法 和 binary_search_by 方 法 
一 样 ， 都 可 以 接收 团 包 参数 ， 但 它们 的 区 别 在 于 ，binary_search_by_key 
方法 接收 的 是 FnMut (&'’ a T) -之 B 闭 包 ， 其 中 B 对 应 于 参数 的 类 型 
(&B) , 4Htk Fbinary_search_by h}, WATVEN MAS Ave m yu E LE 
BST, FAS THA A ARETE AAT. TASER 12 行 定 义 的 数组 
fe AHE — poe T AEP ITA. PROT Ee, EE 
是 按 元 组 第 二 位 来 设置 检索 条 件 的 ， 最 终 返 回 的 结果 是 Result 类 型 。 

上 而 介绍 的 二 分 查找 binary_search 系 列 泛 型 方法 的 前 置 要 求 是 必须 
是 有 序数 组 ， 对 于 没有 排序 的 数组 怎么 办 ? Rust 当 然 也 提供 了 性 能 局 效 
的 排序 方法 : sort 系 列 方法 和 sort_unstable 系 列 方法 。sort 系 列 方法 使 用 
示例 如 代码 清单 8-45 所 示 。 

代码 清单 8-45:_ sort 系列 方法 使 用 示例 


jil ES maing { 

2 Let mut we [-—sis2, a de “3, Alg 
3 六 

4 asserctl (vy == |-3; -37 dy Zr 4))2 
3 V.WSOLE BY(la, D| BemB(b) J} 

6 assert (y == [—5, =3; dy 2 4))3 
7 VsSo0rt Dy(lay Ol Bemp (lay 

8 assert! (y == [y 27 ly -3 -5])2} 
9. v.sort_by key(|k] k.abs()); 

LO; assert! (vy == [dy 2, -3, 4, -5]); 


Lle 2 

在 代码 清单 8-45 中 所 用 到 的 sort、sort_by 和 和 sort_by_key 方 法 ， 其 内 
部 所 用 算法 为 和 目 适 应 从 代 归并 排序 (Adaptive/Iterative Merge Sort) 算 
法 ， 灵 感 来 自 Python 语 言 中 的 TimSort 算 法 。 该 算法 为 稳定 排序 算法 ， 妈 
序列 中 等 价 的 元 系 在 排序 之 后 相对 位 置 并 不 改变 。 其 时 间 复 森 撒 为 O 

(n) ， 最 坏 情况 为 O (nlogn ) 。 

代码 清单 8-45 中 的 sort 系列 方法 均 可 被 直接 蔡 换 为 sort_unstable、 
sort_unstable_by 和 sort_unstable_by_key 方 法 。 但 是 sort_unstable 系列 方 
法 其 内 部 实现 的 排序 算法 为 模式 消除 快速 排序 (Pattern-Defeating 


Quicksort) 算法 ， 充 算法 为 不 稳定 排序 算法 ， 也 瓯 是 说 ， 订 列 中 等 价 的 
元 际 在 排序 之 后 相对 位 置 有 可 能 发 生变 化 。 其 时 间 复 杂 上 度 为 DO (n), 
最 坏 情况 为 D0 n loga ) 。 在 不 考 虑 稳定 性 的 情况 下 ， 推 荐 使 用 
sort_unstable 系 列 方法 ， 其 性 能 要 高 于 sort 系 列 方法 ， 因 为 它们 不 会 占用 
额外 的 内 存 。 

不 管 是 sort 系 列 方法 还 是 sort_unstable 系 列 方法 ， 其 命名 规则 和 
binary_search 系 列 方法 相 类 似 ， 所 以 它们 在 语义 上 也 是 相同 的 ，xxxx_by 
方法 表示 接收 返回 Ordering 类 型 的 财 包 参数 ， 而 XXXX_by_key 方 法 接收 的 
闭 包 参数 窗 新 沁 围 更 三 ， 适 合 表 示 任 意 枪 索 〈( 排 序 ) 条 件 。 

与 排序 和 比较 相关 的 trait 

在 上 面 介 绍 的 诺 多 数组 方法 中 ， 其 实 都 水 及 数组 内 部 元 系 的 比较 ， 
比如 判断 是 否 存 在 、 检 索 和 排序 都 必须 要 在 元 系 间 进行 比较 。 在 Rust 
中 把 比较 操作 也 抽象 为 一 些 triat， 和 定义 在 std: : cmd 模 块 中 。 访 模块 中 
定义 的 trait 是 基于 数学 集合 论 中 的 三 元 关系 仿 序 、 全 友和 等 价 有 的 。 

偏 序 的 定义 ， 对 于 非 空 集合 中 的 a 、b 、c 来 襄 ， 满 足下 面条 件 为 偏 

` ABE: a <a。 

反对 称 性 ， 如果 a <b Hb<a, ， 则 a =b 。 

传递 性 :如果 a <b Hb<c, ， 则 a <c 。 

全 序 的 定义 ， 对 于 非 空 集合 中 的 a 、b 、c 来 说 ， 满 足下 面条 件 为 全 

` 反对 称 性 ， 奉 a <b Ab<a, ， 则 a =b 。 

传递 性 : 石 a <b Hb<c, ， 则 a <c 。 

完全 性 : a <b. b <a 或 a ==b 必须 满足 其 一 ， 表 示 任 何 元 素 都 
可 以 相互 比较 。 

全 订 实 际 上 是 一 种 特殊 的 侦 序 。 

等 价 的 定义 ， 对 于 非 空 集合 中 的 a 、b 、c 来 说 ， 满 足下 面条 件 为 等 
价 天 系 。 

` BRIE: a==b. 

PRE: a ==b ， 意 味 着 b ==a 。 


传递 性 : Fa ==b Hb==c, ， 则 a ==c 。 

在 Rust 中 一 共 涉 及 四 个 trait 和 一 个 枚 举 体 来 表示 上 述 二 元 关系 。 
四 个 trait 分 别 是 PartialEq、Eq、PartialOrd 和 Ord。 这 些 trait 的 关系 可 以 
IZ ALB LA: 

`- PartialEq 代 表 部 分 等 价 天 系 ， 其 中 定义 了 eq 和 ne 两 个 方法 ， 分 别 表 
= | =" BEE 

“ Eq 代表 等 价 关 系 ， 访 trait 继承 目 PartialEq， 但 是 其 中 没有 定义 任 
何方 法 。 它 实际 上 相当 于 标记 实现 了 Eg 的 类 型 拥有 等 价 天 系 。 

PartialOrd 对 应 于 偏 序 ， 其 中 定义 了 partial_cmp、lt、le、gt 和 和 ge 五 
A 

Ord 对 应 于 全 序 ， 其 中 定义 了 cmp、max 和 min 三 个 方法 。 

还 有 一 个 枚 举 体 为 ”Ordering， 用 于 表示 比较 结果 ， 其 中 定义 了 小 
于 、 等 于 和 大 于 三 种 状态 。 

代码 清单 8-46 展 示 了 PartialEq 和 Egq 的 定义 。 

代码 清单 8-46: PartialEq 和 Eq 定义 
i! #[lang = "eq"] 

2 pub trait PartialEq<Rhs = Self> 

3 where Rhs: ?Sized, 

4. { 

a fn eq(&self, other: &Rhs) -> bool; 

6 fn ne(&self, other: &Rhs) -> bool { ... } 
/ } 

8 pub trait Eg: PartialEq<Self> { } 

PartialEq 中 定义 了 eq 和 ne 方法 ， 但 是 其 中 ne 有 默认 实现 。 如 有 果 需 要 
实现 PartialEq， 只 需要 实现 eq 这 一 个 方法 就 可 以 。Eg 实 则 起 标记 作用 ， 
并 没有 实际 的 方法 。 

代码 清单 8-47 展 示 了 PartialOrd 的 定义 。 

代码 清单 8-47:， PartialOrd 定 义 


ls pub trait PartialOrd<Rhs = Self>: PartialEaq<Rhs> 
2. where Rhs: ?S1ized, 
Sx 4 
4. fn partial cmp (self; other: &Rhs) -> Option<Ordering>; 
a fn lt(&self, other: &Rhs) -> bool { ... } 
6. fn le(&self, other: &Rhs) -> bool { ... } 
Te inh gÈ (Sse, others éns] -> bool | pss | 
Six fn ge(&self, other: &Rhs) => bool { sax } 
3 } 
10. pub enum Ordering { 
i a Less, 
tes Equal, 
lia Greater, 
14. } 


代码 清单 8-47 展 示 了 定义 于 std: : cmp 模 块 中 的 PartialOrd。 该 trait 
中 定义 了 五 个 方法 ， 其 中 partial_cmp 方 法 表示 具体 的 比较 规则 ， 注 意 其 
i& |=] Option< Ordering > 2844, VAT Tae EC BOR DL, FPA ZERIT A 
元 系 都 具有 可 比 性 ， 有 些 元 系 的 比较 结果 可 能 为 None。 其 他 四 个 方法 
It、le、gt、ge ， 分别 代 表 小 于 、 小 于 或 等 于 、 大 于 和 大 于 或 等 于 ， 包 售 
了 上 默认 实现 。 如 果 要 给 某 个 类 型 实现 PartialOrd， 只 需要 实现 partial_cmp 
方法 即 可 。 

代码 清单 8-48 展 示 了 Ord 的 定义 。 

代码 清单 8-48: Ord 定 义 


al pub trait Ord: Eq + PartialOrd<Self> { 

fu fn cmp(&self, other: &Self) -> Ordering; 
ic fn max(self, other: Self) => Self { ... } 
4 fn min(self, other: Self) -> Self { ... } 
5 } 


从 代码 清单 8-48 中 可 以 看 出 ，Ord 继 承 自 Eq 和 PartialOrd， 这 是 因为 
全 序 的 比较 必须 满足 三 个 条 件 : 反对 称 性 、 传 递 性 和 完全 性 ， 其 中 完全 
性 一 定 是 每 个 元 系 都 可 以 相互 比较 。 举 个 例子 ， 在 浮 点 数 中 用 于 定义 特 
殊 情况 值 而 使 用 的 NaN, KERAMA E, BA NaN! =NaN， 它 不 


满足 全 序 的 完全 性 ， 所 以 浮 点 数 只 能 实现 PartialEq 和 PartialOrd， 而 不 能 
实现 Ord。 如 果 要 实现 Ord， 只 需要 实现 cmp 方 法 即 可 ， 因 为 max 和 min 都 
有 默认 实现 。 注 意 cmp 方 法 返回 Ordering 类 型 ， 而 不 是 Option 二 Ordering 
类 型 ， 因 为 对 于 全 序 关 系 来 说 ， 每 个 元 系 都 是 可 以 获得 合法 的 比较 结 
TRY © 

在 Rust 中 基本 的 原生 数字 类型 和 字符 串 均 已 实现 了 上 述 trait， 如 代 
名 清早 8-49 所 示 。 

代码 清单 8-49: 比较 操作 示例 


li use std::cmp::Ordering; 

2 fn main() { 

3 lec Fesult. = 1:O0:partial emoia2.0)s 

4 assert eq! (result, Some (Ordering: *Less) ) + 

a let result = 1l.cmp(é&l); 

6 assert eq! (result, Ordering: : Equal)? 

7 let result = “abc” .partial emp ("Aore")? 

8 二 
9 let mE Ve [E32 S] = Pew, .1 
LU a v.sort by(la, S| a.partaal emp (b) -unwrap () ) ; 
ami E assert! {y == [lyss 2:5, 333% Seley Se Ul); 

Le v.sort by(l|a, b| b.partial cmp(a).unwrap()); 
L3 SESE == (2.0, @.1, 8.2. Cady dink | Ti} 


14. | 

在 代码 清单 8-49 中 ， 代 码 第 3 行 比 较 的 是 序 点 数 ， 只 能 用 偶 序 比 
较 ， 上 所 以 使 用 partial_cmp 方 法 ， 最 终 返 回 Some (Ordering: : Less) ， 
如 代码 第 4 行 所 示 。 

代码 第 5 行 比 较 的 是 整数 类 型 ， 满 足 全 序 天 系 ， 所 以 使 用 cmp 77 
法 ， 最 终 返 回 Ordering: : Equal. 

代码 第 7 行 比 较 的 是 字符 串 ， 满 足 偶 序 关 系 ， 其 黑 认 为 字典 序 ， 也 
束 是 按 字 人 符 串 冯 字 母 进行 比较 的 ， 所 以 使 用 partial_cmp 方 法 。 最 终结 果 
如 代码 第 8 行 所 示 。 

代码 第 9 行 定 义 了 一 个 浮上 点 数 数组 ， 代 码 第 10 行 使 用 sort_by 方 法 为 
其 排序 ， 传 入 的 财 包 参数 为 apartial cmp (b) 。 而 sort_by 是 按 a 和 b 的 比 


较 结 果 是 否 等 于 Less 的 规则 进行 排序 的 ， 如 果 a 小 于 bp， 则 为 升序 ， 如 代 
但 第 11 行 所 示 ; 如 末 b 小 于 a， 则 为 降序 ， 如 代码 第 13 行 所 示 。 

如 果 要 在 自 定 义 类 型 中 实现 相关 trait， 则 必须 搞 清 楚 全 序 和 偏 序 关 
系 ， 然 后 再 实现 相应 的 trait。 可 以 手工 实现 ， 也 可 以 使 用 ##[derive] 来 目 
动 派生 。 

回顾 与 展望 

本 节 虽 然 重 点 介绍 的 是 Vector， 但 是 里 面 涉及 的 方法 同样 适用 于 
array. ALA KEE Sh Eee WIT] ”类 型 实现 的 ， 如 代码 清单 8-50 所 
ZN o 

iS is 28-50: 为 [TT 类 型 实现 的 方法 


lL. pub trait SlaiceExt 1 

2 type Item; 

3 TT 

4 fn split<P>(&self, pred: P) -> Split<Self::Item, P> 
D's where P: FnMut(&Self::Item) -> bool; 

6 

7 fn binary search(&self, x: &Self::Item) -> Result<usize, usize> 
8 where Self::Item: Ord; 

9 fn len(&self) -> usize; 

LY x fn is empty(&self) -> bool { self.len() == } 

Lis fn iter mut(&mut self) -> IterMut<Self::Item>; 

Li; fn swap (&mut self, a: usize, b: usize); 

13. fn contains(é&self, x: &Self::Item) -> bool 

14, where Self::Item: Partialkq; 

135 tn clone from eline(émut self, ere: &[selty: trem) 
LO. where Self::Item: Clone; 

ile f in copy from slice (émit sélf, sre: ) 
LG, where Self::Item: Copy; 

L3; fn sort _unstable(&mut self) where Self::Item: Ord; 
20. } 

21. impl<T> SliceExt for [T] { 

Le type Item = T; 

23 

24. } 


在 代码 清单 8-50 中 展示 了 定义 于 core; :slice 模块 中 的 SliceExt， 1% 
trait 中 定义 了 很 多 方法 ， 这 里 只 展示 了 一 部 分 ， 本 节 介 绍 过 的 一 些 方法 
都 定义 于 其 中 。 从 代码 第 21 行 可 以 看 到 ， 实 际 上 为 [T] 类 型 实现 了 
SliceExt。 

当然 ，array 也 有 目 己 专用 的 方法 ， 比 如 连接 两 个 array 可 以 使 用 join 
方法 。 在 标准 库 中 还 为 数组 提供 了 很 多 其 他 方法 ， 限 于 扁 幅 ， 这 里 无 法 
一 一 介绍 ， 但 是 可 以 在 标准 库 文档 中 看 到 每 个 方法 的 具体 方法 签名 和 使 
用 示例 。 

在 Rust 2018 中 ， 还 加 入 了 针对 array 数 组 和 切片 进行 match 匹 配 的 新 


语法 。match 匹 配 array 数 组 示例 如 代码 清单 8-51 所 示 。 
代码 清单 8-51，match 匹 配 array 数 组 示例 


FH LO [ISa SIF 4 

2 match arr { 

3 la #« a SA prantin: ("snags with 2"); 
4 lap on Cl] => BIRCH ey hs Bs TET, Bs Uly 
3 = EL ("pagel") , 

6 } 

7 } 

8 fn main() { 

9 bet ere = fle 2e ol} 

Ls pick(arr]y 

i ie 星 lem arr = [ls Ze 9l: 

12. DLOK (arr) 3 

Lead a let arr = [1, 3, 5] 

14. pLek(arr) ; 


TS et d 
在 代码 清单 8-51 中 实现 了 pick 函数 ， 它 接收 一 个 定 长 的 数组 ， 通 
过 匹配 数组 的 不 同 元 际 ， 可 以 实现 指定 的 功能 。 访 代码 可 以 挑选 出 以 3 
结尾 和 第 二 个 元 款 为 2 的 数组 。 注 意 match 匹 配 的 最 后 一 个 分 文 ， 必 须 使 
用 通配符 或 其 他 变量 来 务 太 枚 举 。 
当前 Rust 使 用 array 数 组 局 限 性 比较 大 ， 不 过 访 语 法 还 文 持 数组 切 
请 ， 所 以 利用 数组 切片 就 可 以 模拟 变 长 参数 的 函数 ， 如 代码 清单 8-52 所 
ZN o 
代码 清单 8-52: match 匹配 数组 切片 示例 


th Suni (hime &TaSzZ1) 4 


- | 


.| 


match num 4 
[one] => println!(" at least two"), 
(first, second] => println! ( 
wie2} + {PP} = {$2} T, First, second, first+second 
)y 
_ =P printing { 
"Sm. 18 (873) ", HUM rer (COl; | stim 1] sum + T) 
)y 
} 


< th. Wain) ¢ 
sum(&[1]); // at least two 
sum(&[1, 217; ji 1+ 2 =3 
sum(&(1, 2, 3] )z // sum is 6 
Srl 27 3 SIR A gwm is 11 


在 代码 清单 8-52 中 利用 数组 切片 的 match 语 法 ， 模 拟 了 可 变 参数 的 
sum 函 数 的 实现 。 从 输出 结果 可 以 看 出 ， 切 片 数组 不 同 的 元 素 个 数 ， 产 
生 了 不 同 的 输出 结 


8.2.2 映射 集 


EA Toate, FMA AAA Ze TERR INS (Map) KRJ. 
Map 是 依照 键 值 对 〈Key-Value) 形式 存储 的 数据 结构 ， 每 个 键 值 对 都 
被 称 为 一 个 Entry 。 在 Map 中 不 能 存在 重复 的 Key， 并 且 每 个 Key 必 须 有 
一 个 一 一 对 应 的 值 。Map 提 供 的 租 找 、 插 入 和 删除 操作 的 时 间 复 杂 上 度 基 
本 都 是 O (1) ， 最 坏 情况 也 只 是 O (n) ， 虽 然 需 要 消耗 额外 的 空间 ， 
但 是 随 看 当下 可 利用 的 内 存 越 来 越 多 ， 这 种 用 空间 换 时 间 的 做 法 也 是 值 
得 的 。Rust 提 供 了 两 种 类 型 的 Map: 基于 哈 希 表 (HashTable〉 的 
HashMap 和 基于 多 路 平衡 否 找 树 (B-Tree) 的 BTreeMap . AWE 
介绍 HashMap。 

HashMap. itl, A A 


26. 
ah i 
2B a 


代码 清单 8-53 展 示 了 部 分 HashMap 使 用 示例 。 
代码 清单 8-53: 部 分 HashMap 使 用 示例 


use std::collections::HashMap; 


fn main() { 


let mut book reviews = HashMap::with capacity(10); 
book réviews..insert ("Rust Book", "“good"); 
book reviews..insert ("Programming Rust", "pice"; 
book reviews.insert ("The Tao of Rust", “deep™) ; 
for key in book reviews.keys() { 
printini ("23", key): 
} 
fer val in book reviews.values() 1 
princlini "ii": wal): 
} 
if [book reviews.contains key("rust book") { 
printin! ("find {} times ", book reviews,1en ()) 7 
} 
book reviews.remove ("Rust Book") ; 
let to find = ("RUST Book”, "The Tao of Rust"); 
for book in &to find { 
match book reviews.get (book) 1 
Some (review) => println! ("{}: {}", book, review), 


None => println! ("{} is unreviewed.", book), 


| 
for (book, review) in &book reviews { 
println! ("{}s WWJ Beek, review); 


assert eg! (book reviews ("The Tao of Rust™], “deep™); 


在 代码 清单 8-53 中 ， 使 用 HashMap: : with_capacity 方 法 来 创建 一 
空 的 HashMap， 跟 String 或 Vector 类 似 ， 广 方法 可 以 预 分 配 内 存 。 同 
样 ， 也 可 以 使 用 HashMap: : new， 但 不 会 预 分 配 内 存 。 


WES 4~6 行 ， 通 过 insert 方法 同 HashMap 中 插入 字符 串 字 面 量 
FRAG A EAE, ECP HashMap 28 44 ti jE AHashMap<&str, &str>. 
代码 第 7 一 12 行 ， 通 过 keys 和 values 方 法 可 以 分 别 单独 获取 HashMap 
中 的 键 和 值 ， 注 意 这 两 个 方法 是 友 代 左 。 因 为 HashMap 是 无 序 的 映射 
表 ， 所 以 在 从 代 键 和 值 的 时 候 ， 输 出 的 顺序 并 不 一 定 和 插入 的 顺序 相 
同 。 
代码 第 13 一 15 行 ， 使 用 contains_key 方 法 来 查找 指定 的 键 ， 如 果 没 
有 找到 ， 束 输出 相应 的 信息 ， 如 代码 第 14 行 所 示 ， 这 里 通过 len 方 法 输 
出 J HashMap AX KE. 
代码 第 16 一 23 行 ， 使 用 remove 方 法 按 指 定 的 键 删 除 HashMap 中 的 一 
个 键 值 对 ， 然 后 在 对 HashMap 的 运 代 中 通过 get 方 法 逐个 得 找 指 定 的 键 。 
因为 get 方 法 返回 的 是 Option 二 TT 二 类 型 ， 所 以 这 里 需要 用 match 进 行 匹 
配 。 如 果 找 到 ， 则 匹配 Some (review) ， 打 印 键 值 对 ; 如果 没 找 到 ， 
则 输出 相关 信息 。 
代码 第 24 一 26 行 ， 通 过 元 组 (book，review) 在 for 循 环 中 分 别 使 用 
键 (book) 和 值 (review) 。 
代码 第 27 行 ， 通 过 Index 语 法 可 以 按 指 定 的 键 来 获取 对 应 的 值 。 这 
里 需要 注意 的 是 ， 目 前 Rust 内 支持 Ihdex， 而 不 支持 IhdexMut。 也 就 古 
说 ， 只 可 以 通过 hash[key] 方 式 来 取 值 ， 而 不 能 通过 hash[key]=value 方 式 
来 插入 键 值 对 ， 这 是 因为 针对 该 特性 正在 准备 一 个 更 好 的 设计 方案 ， 并 
在 不 远 的 将 来 得 到 文 持 。 
Entry? xk 
对 于 HashMap Ho Ay BS (Bucket) 来 说 ， 其 状态 无 非 
是 “ 空 2 和 “* 满 ?， 所 以 Rust 对 此 做 了 一 层 抽 象 ， 使 用 Entry 枚 举 体 来 表示 每 
个 键 值 对 ， 如 代码 清单 8-54 所 示 。 
代码 清单 8-54: Entry 定 义 
1 pub enum Entry<"*a, Ki ‘a, Ve ‘a> { 
ve Occupied (OccupiedEntry<'a, K; V>), 
3 Vacant (Vacantintry<"*a, Ky Ve) 5 
4. } 


在 代码 清单 8-54 中 展示 了 Entry 的 定义 ， 其 中 包含 两 个 变 体 : 


Occupied (OccupiedEntry<" a, K, V>) 和 Vacant (VacantEntry<'’ 
a, K, V>) 。 OccupiedEntry<’ a, K, V>A#lVacantEntry<’ a, K, 
V> 征 内 部 定义 的 两 个 结构 体 ， 分 别 对 应 HashMap 撒 层 棚 的 存储 信息 。 
其 中 Occupied 代 表 占 用 ，Vacant 代 表 留 空 。 

Entry 一 共 实 现 了 三 个 方法 ， 通 过 这 三 个 方法 可 以 方便 地 对 HashMap 
中 的 键 值 对 进行 操作 ， 如 代码 消 单 8-55 所 示 。 

代码 清单 8-55: entry 方 法 使 用 示例 


1. use std::collections::HashMap; 

2a En Maan) i 

3 let mut map: HashMap<éstr, u32> = HashMap: :new(); 
4 fap. LLY ("OUrKeNnt year") .or Insert (2017) 7 

ae assent ec) (Wap (“cimment year" |, 2017) 5 

6 *map.entry ("current year”) wor insert(Z01/) += 10; 
7 assert eq! (map["current year"), 2027); 

8 let. last leap year = 2016; 

9 ap.entry ("next leap year”) 

Lys Or insert with(|| Last leap year + 4 ); 

Lis assert eq! (map["next leap year"], 2020); 

LAs assert 6g! (tap .entry "BUTEN year”) .key(), &"current year"); 
Lew J 


在 代码 清单 8-55 中 展示 了 Entry 枚 举 体 实现 的 三 个 稳定 的 方法 : 
or_insert、or_insert_with 和 key。 要 使 用 这 三 个 方法 ， 必 须 先 通过 entry 方 
法 得 到 Entry<K，V>。 

代码 第 3 行 ， 使 用 HashMap: : new 创 建 了 一 个 空 的 HashMap。 代 三 
第 4 行 ， 通 过 entry 方 法 ， 将 键 作 为 参数 传 入 得 到 Entry。 本 例 中 的 键 
为 "current_year"， 它 被 传 入 entry 方 法 内 部 之 后 ， 首 先 会 判断 哈 希 表 是 个 
AEREE, WRIA, WTA ST A. Pe ROR A ab hash ex 
数 生 成 此 键 的 hash 值 ， 然 后 明 过 这 个 hash 值 在 搬 层 的 哈 希 表 中 搜索 ， 如 
果 能 找到 此 键 ， 则 返回 相应 的 桶 (Occupied〉; 如 果 找 不 到 ， 则 返回 空 
桶 (Vacant) 。 最 后 ， 将 得 到 的 桶 转换 为 Entry 二 K，V 这 并 返回 。 

在 得 到 Entry 之 后 ， 残 可 以 调用 其 实现 的 or_insert 方 法 ， 议 方法 的 参 
数 束 是 要 插入 的 值 ， 并 且 返 回 该 值 的 可 变 借用 。 所 以 才 可 以 像 代码 第 6 


行 那 样 ， 通 过 解 引 用 操作 符 “*” 对 or_insert 方 法 的 结果 进行 修改 。 

代码 第 8 一 10 行 ， 使 用 or_insert_with 方 法 可 以 传递 一 个 可 计算 的 团 
包 作 为 要 插入 的 值 。 注 意 ， 其 只 允许 传 入 FnOnce O ->V 的 财 包 ， 也 
束 是 说 ， 闭 包 不 能 包含 参数 。 

代码 第 12 行 ， 可 以 通过 key 方 法 来 获取 Entry 的 键 。 

代码 清单 8-56 展 示 了 or_insert 方 法 的 源 但 。 

代码 清单 8-56: or_insert 方 法 源码 


Lae pub in or anserte (self, defaults V) => &'a Mit V 1 
2 match self { 

3 Occupied(entry) => entry.into mut(), 

4. Vacant(entry) => entry.insert(default), 

2 } 

6 } 


从 代码 清早 8-56 中 可 以 看 出 ， 通 过 entry 方 法 从 的 层 找 到 相应 的 桶 之 

后 ， 再 通过 match 方 法 分 别处 理 不 同 美 型 的 棚 。 如 有 条 是 占用 的 本 
(Occupied (entry) ) ， 则 通过 into_maut 方 法 将 其 变 成 可 变 借 用 ， 这 样 

WL AY Darth A WY Be 73 it WR EAH (Vacant Centry) ) ， 则 使 
用 相应 的 insert 方 法 直接 插入 ， 注 意 此 时 的 insert 方 法 是 为 VacantEntry 定 
义 的 insert 方 法 。 

合并 HashMap 

如 采 需 要 合并 两 个 HashMap， 则 可 以 使 用 迭代 器 的 方式 ， 如 代码 清 
单 8-57 所 示 。 

代码 清单 8-57: HashMap 的 三 种 合并 方式 


use std::collections::HashMap; 

in merge extend<" a>( 
Maples Smut HashMap<é&"a str, &'a str, 
map2: HashMap<é&'a str, &'a str> 

ti 
mapl.extend(map2) ; 

} 

fn merge chain<"a> ( 
mapl: HashMap<&'a str, &"a str>, 
mapaz? HashMap<6"a str, &"a@ sir 

) => HashMap<G’a Str; &'a Cr | 
Mati. IALO TESE () -CIELI (Mar ) .col leer () 


a AN 


} 


} 


. In merge by Yef<'a>{ 


map: &mut HashMap<é'a str, &'a str>, 
map ref: &HashMap<é'a str, &'a str> 


map.extend(map ref.into iter () 
map {| (k; v)| (k.clone(), v.clone())) 


yy 


w £A main() { 


let mut book reviewsl = HashMap: :new() ; 

book reviewsl.insert ("Rust Book", "good") ; 

book reviewsl.insert ("Programming Rust", "nice"); 
book, réviewsl.insert ("The Tao of Rust", "deep"); 
let mut book reviews2 = HashMap: :new() ; 

book revlewsz.insert ("Rust in Action", "“good"); 
pook Yeviewsz, insert ("Rust Primer"; “nice”) ; 

book, reviews2.insert ("Matering Rust", "deep"); 

// merge extend(&mut book reviewsl, book reviews2) ; 
// let book reviewsl = merge chain(book reviewsl, book reviews2) ; 
merge by ref(&mut book reviewsl, &book reviews2) ; 
for key iñ book reviewsl.keys() { 


printin! ("H F"; key); 


在 代码 清单 8-57 中 展示 了 HashMap 的 三 种 合并 方式 。 

代码 第 2 一 7 行 ， 定 义 了 merge_extend 方 法 ， 通 过 extend 方 法 来 合并 
两 个 HashMap。 代 但 第 31 行 调用 了 此 方法 。 本 质 上 ， 在 extend 方 法 内 部 
{Hk} HashMap #4 He A Th as tT BRE o 

代码 第 8 一 13 行 ， 定 义 了 merge_chain 方 法 ， 同 样 是 通过 into_iter 得 到 
Chain 欠 代 磊 ， 然 后 合并 的 。 代 人 码 第 32 行 是 对 访 方 法 的 调用 。 

代码 第 14 一 21 行 ， 定 义 了 merge_by ref 方法， 使 用 的 同样 是 

extend， 只 不 过 传 入 了 第 二 个 HashMap 的 引用 。 代 码 第 33 行 调用 了 此 方 
法 ， 其 参数 都 是 引用 ， 它 不 会 把 两 个 HashMap 的 所 有 权 转 移 挤 ， 所 以 代 
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HashMap 撒 层 实现 原理 
不 管 哪 门 语言 ， 实 现 一 个 HashMap 的 过 程 均 可 以 分 为 三 大 步骤: 
(1) 实现 一 个 Hash 钢 数 。 
(2) 合理 地 解决 Hash 冲 突 。 
(3) 实现 HashMap 的 操作 方法 。 
HashMap 的 底层 实际 上 是 基于 数组 来 存储 的 ， 当 插入 键 值 对 时 ， 并 
不 是 直接 插入 该 数组 中 ， 而 是 通过 对 键 进 行 Hash 运 算得 到 Hash 值 ， 然 后 
和 数组 的 容量 〈Capacity) 取 模 ， 得 到 具体 的 位 置 后 再 插入 的 。 
HashMap 插 入 过 程 示 意图 如 图 8-9 所 示 。 


map.entry("year").or_insert(201 7) 


Capacity 


| | f le | | | | ee 


idx 


| 


| pp hash("year") 
year * | Function d % 
Capcacity 





图 8-9: HashMap 插 入 过 程 示意 图 

从 HashMap 中 取 值 的 过 程 与 之 相似 ， 对 指定 的 键 求 得 Hash 值 ， 再 和 
容量 取 模 之 后 束 能 得 到 的 层 数 组 对 应 的 索引 位 置 ， 如 果 指 定 的 刍 和 存储 
的 键 相 匹配 ， 则 返回 访 键 值 对 ;， 如 果 不 匹 配 ， 则 代表 没有 找到 相应 的 
BE o 

TEE Pe i FE ee Hashes 20g ~M Hash K AMN TE BE 
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发 生 。 人 简单 来 说 ，Hash 函 数 相 当 于 把 原来 的 数据 映射 到 一 个 比 它 更 小 的 
空间 中 ， 所 以 冲突 是 无 法 避免 的 ， 可 以 做 的 只 能 是 减少 ”Hash 人 页 撞 发 生 


HE. “SI A Hash ek Ge RS ALPE, br DA tall ft SY HE 2 p 
低 。 

Hasht (Hash Collision) 也 叫 Hash 证 突 ， 是 指 两 个 元 素 通 过 
Hash 函 数 得 到 了 相同 的 索引 地 址 ， 该 存储 哪 一 个 是 需要 解决 的 问题 ， 而 
这 两 个 元 素 就 叫 作 同义词 。 除 Hash 函数 的 好 坏 之 外 ，Hash 冲突 还 取决 
于 负载 因子 (Load Factor) ”这 个 因 系 。 人 负载 因子 是 存储 的 健 值 对 数目 
与 容量 有 的 比例 ， 比 如 容量 为 100， 存 储 了 90 个 键 值 对 ， 人 负载 因子 就 是 
0.9。 人 负载 因子 决定 了 HashMap 什 么 时 候 扩 容 ， 如 果 它 的 值 太 大 了 ， 则 许 
明 存 储 的 键 值 对 接近 容量 ， 增 加 了 冲突 的 风险 ;如果 值 太 小 了 ， 则 浪费 
Hj HMA, H Hash 函数 和 人 负载 因子 是 不 行 的 ， 还 需要 有 为 外 解决 
冲突 的 方法 。 

Rust 标 准 库 实现 的 HashMap， 上 默认 的 Hash 函 数 算法 是 SipHash13。 田 
外 ， 标 准 库 还 实现 了 SipHash24。SipHash 算 法 可 以 防止 Hash 磁 撞 拒 绝 服 
务 攻 击 (Hash Collision DoS) ， 这 种 攻击 是 一 种 基于 各 语言 Hash 算 法 
的 随机 性 而 精心 构造 出 来 的 增强 Hash 碰 撞 的 手段 ， 被 攻击 的 服务 器 CPU 
占用 率 会 轻松 地 诡 升 到 100%， 造 成 服务 的 性 能 呈 指 数 级 下 降 。 正 是 基 
于 这 个 原因 ， 很 多 语言 都 换 成 了 SipHash 算 法 ， 该 算法 配合 随机 种 子 可 
以 起 到 很 好 的 防范 作用 。Rust 提 供 的 SipHash13 性 能 更 好 ， 而 SipHash24 
更 安全 。 但 使 用 SipHash 并 非 强制 性 的 ，Rust 提 供 了 可 插 拔 ” 的 实现 机 
制 ， 让 开发 者 可 以 根据 实际 需要 更 的 Hash 算法 ， 比 如 换 成 随机 性 更 好 
的 Fnv 算 法 。 
代码 清单 8-58 展 示 了 与 Rust 中 Hash 相 关 的 trait 源 码 。 

代 人 码 清 单 8-58: Rust 中 与 Hash 相 关 的 trait 源 码 
pub trait Hasher { 
fn finish(&self) -> u64; 
fn write(&mut self, bytes: &[u8]); 
} 
pub trait Hash { 
fn hash<H>(&self, state: &mut H) where H: Hasher; 


og & WwW HN EF 


Te 9} 
6. pub trait BuildHasher 1 


9 type Hasher: Hasher; 
lus fn Bulld,. nasner (éeelt) -> SelrriHasher; 
有 } 


代码 清单 8-58 只 是 展示 了 部 分 与 Hash 相 天 的 trait 大 人 取 。 代 码 第 1 一 4 
行 定义 的 Hasher 是 对 有 基体 Hash 算 法 的 抽象 ， 其 中 write 方法 根据 传 入 的 
键 写 入 相应 的 映射 结果 ，finish 方 法 则 得 到 最 终 的 写 入 结果 。 

代码 第 5 一 7 行 定义 了 Hash trait, APES 了 hash 方 法 ， 是 对 Hasher 
中 write 行 为 的 包装 。 

代码 第 8 一 11 行 定义 的 BuildHasher ”， 则 是 对 Hasher 的 抽象 ， 通 过 
build_hasher9] 以 指定 适合 的 Hasher。 

这 三 个 trait 是 Rust 中 Hash 算 法 可 插 拔 的 基础 。 在 Rust 中 ， 每 个 实现 
了 Hash 和 Eq 两 个 trait 的 类 型 ， 均 可 以 作为 HashMap 的 键 ， 所 以 并 不 能 
直接 用 浮 点 数 类 型 作为 HashMap 的 键 。 代 但 清单 8-59 展 示 了 第 三 方 包 fnv 
实现 的 Env 算 法 。 

代码 清单 8-59，Enii 算 法 实现 源 但 


pub struct FnvHasher (u64) ; 

2 impl Hasher for FnvHasher { 

3 Fr finish (eselft) => used 4 

4 self.0 

5, } 

6 fn write(&mut self, bytes: &[u8]) { 
q let FnvHasher (mut hash) = *self; 
8 for byte in bytes.iter() { 

9 . hash = hash ^ (*byte as u64); 
LI i hash = hash.wrapping mul (0x100000001b3) ; 
LT } 

| *self = FnvHasher (hash) ; 

t3. } 

14. } 


代码 清单 8-59 只 是 展 示 了 部 分 源码 ， 可 以 看 出 ， 只 需要 实现 Hasher 
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代码 清单 8-60: HashMap 实 现 源码 
pub struct HashMap<K, V, S = RandomState> { 
hash. builders: 5, 
table: RawTable<K, V>, 


Fesize policy? Detau lr Resi zgerolicy, 


il 
2 
3 
4. 
De +f 
6 impl<K: Hash + Eg, V> HashMap<K, V, RandomState> | 
a pub fn new() -> HashMap<K, V, RandomState> { 
8 Default: :default () 
9 。 
LD xe I 
lie ampil<K, Ve B= Default for HashMap<K, Ve Ga 
lës where K: EG + Hash, S: BuildHasher + Default 
1 { 
Let tn default() -> HashMap<K, V, 5> i 
LS HashMap: iwith hasher (Default: default () ) 
16% } 
i J 
在 代码 清单 8-60 中 ， 代 码 第 1~5 行 是 HashMap 结构 体 的 定义 ， 
包含 了 三 个 字段 : hash_builder、table 和 resize_policy。 其 中 hash_builder 
字段 指定 了 泛 型 类 型 S$， 且 给 定 了 一 个 RandomState 类 型 ，RandomState 
类 型 实际 包装 了 一 个 DefaultHasher， 它 指定 了 SipHasher13 为 默认 的 
Hash 算法 ， 并 且 RandomState 在 线程 局 动 时 指定 了 一 个 随机 种 子 ， 以 此 
来 增强 对 Hash 磁 撞 拒 绝 服 务 的 你 护 。 
table 字 上 段 是 HashMap 用 于 压 层 存储 的 数组 RawTable<K, V>. 
resize_policy 属 于 预 留 字段 ， 用 于 以 后 方便 从 外 部 指定 HashMap 的 扩容 
束 略 ， 现 在 还 未 有 其 体 实现 ， 当 前 的 默认 扩容 案 略 为 负载 因子 达到 0.9 
时 则 进行 扩容 。 
代码 第 6 一 10 行 ， 为 HashMap 实 现 了 new 方 法 ， 该 方法 调用 的 是 
Default: : default 方 法 。 从 代码 第 11 一 17 行 可 以 看 出 ，HashMap 实 现 了 


Default trait， 其 中 with_hasher 方 法 调用 的 是 默认 的 SipHasher13。 

现在 完成 了 第 一 步 ， 实 现 并 创建 了 合理 的 Hash 函数 ， 接 下 来 要 寻 
找 一 种 方法 来 合理 地 解决 Hash 冲 突 。 在 业界 一 共有 四 类 解决 Hash 冲 突 的 
方法 : 外 部 拉链 法 、 开 放 定 址 法 、 公 共 洲 出 区 和 再 Hash 法 。 

外 部 拉链 法 ”并 不 直接 在 桶 中 存储 刍 值 对 ， 它 基于 数组 和 链表 的 组 
合 来 解决 冲突 ， 每 个 Bucket 都 链接 一 个 链表 ， 当 友 生 冲突 时 ， 将 冲突 的 
刍 值 对 插入 链表 中 。 外 部 拉链 法 的 优点 在 于 方法 人 简单， 非 同义词 之 间 也 
不 会 产生 聚集 现象 〈 相 比 于 开放 定 址 法 ) ， 并 有 日 其 空间 结构 是 动态 申请 
的 ， 所 以 比较 适合 无 法 确定 表 长 的 情况 ， 缺 点 是 链表 指针 需要 额外 的 罕 
间 ， 并 且 遇 到 人 肆 撞 拒绝 服务 时 HashMap 会 退化 为 单 链表 。 

开放 定 址 法 ”是 指 在 发 生 冲 突 时 直接 去 寻找 下 一 个 空 的 地 址 ， 只 要 
底层 的 表 足 人 够 大 ， 束 总 能 找到 空 的 地 址 。 这 种 寻找 下 一 个 空地 址 的 行 
为 ， 叫 作 探 测 (Probe)  。 如 何 探测 也 是 非常 有 讲究 的 ， 直 接 依 次 一 个 
个 地 寻找 叫 作 线性 探测 (Linear Probing) ， 但 是 它 在 处 理 冲突 时 很 容 
易 聚 集 在 一 起 。 因 此 还 有 二 次 探 出 (Quadratic Probing) , MZA æ H 
前 最 常用 的 一 种 探测 方法 。 男 外 还 有 随机 探测 ， 像 Ruby 语 言 在 2.4 版 本 
中 束 使 用 了 这 种 探测 方法 ， 在 此 之 前 ，Ruby 用 的 还 是 外 部 拉链 法 来 解决 
种 突 问 题 ， 而 Python 中 的 字典 使 用 的 是 开放 定 址 法 和 二 次 探测 。 开 放 定 
址 法 的 优点 在 于 计算 人 简单、 快捷 ， 处 理 方便 ;缺点 是 它 会 产生 聚集 现 
BR, FPF AAR CABARET TER. 
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在 其 中 。 再 Hash 法 Whee tate Ab PHashe BOR SF Hashie. PART 
法 不 太 和 名 用 。 

Rust 采 用 的 是 开放 定 址 法 加 线性 探测 ”， 对 于 线性 探测 容易 聚集 在 
一 起 的 缺陷 ，Rust 使 用 了 罗宾汉 (Robin Hood Hashing) 算法 来 解 
Ro ÆRTER MET, RERE MEIA; 如 果 壳 到 桶 已 经 个 占 
用 ， 那 么 就 要 看 占用 这 个 桶 的 刍 值 对 是 经 历 过 几 次 探测 才 被 插入 该 位 置 
的 ， 如 采访 键 值 对 的 探测 次 数 比 当前 竺 插入 的 键 全 对 的 探测 次 数 少 ， 则 
ERTED SUES NRA ILE, FRR B-MYB 
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图 8-10 展 示 了 Rust 标 准 库 中 HashMap 的 实现 思路 。 
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图 8-10: Rnust 标 准 库 中 HashMap 实 现 思路 示意 图 

当 调 用 HashMap 的 insert 方 法 时 ， 首 先 会 通过 make_hash 方 法 ， 将 传 
入 的 键 生成 Hash 信 ， 通 过 内 部 的 特殊 处 理 〈 为 了 防止 冲突 ) 生成 
SafeHash。 得 到 Hash 值 之 后 ， 通 过 resize 方 法 判断 是 否 需 要 扩容 ， 不 管 
是 个 需要 扩容 ， 最 终 都 会 调用 到 search_hashed 方 法 。 

search_hashed 方 法 需要 三 个 参数 : HashMap 的 内 部 table 指 针 、 
SafeHash 和 用 于 指定 检索 条 件 的 FnMut (&K) -> bool. BAK 
按 线性 探测 来 寻找 桶 的 ， 如 采 找 到 的 是 “ 空 桶 (Vacant) ”, MARR 
al, FEA, A PAPER AY IRRA. BU NoElem#INeqElem, 7} 
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代码 清单 8-61 展 示 了 VacentEntryState 内 部 定义 。 

代码 清单 8-61: VacentEntryState 内 部 定义 

1. enum VacantEntryState<K, V, M> { 


Bx NegElem(FullBucket<K, V, M>, usize), 
ce NoElem(EmptyBucket<kK, V, M>, usize), 
4. } 


从 代码 清单 8-61 中 可 以 看 出 ，NeqElem 是 对 FullBucket 的 包装 


NoElem#e X{EmptyBucketH!) 28, X ARRE oy ll CE JERE h H 
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VacantEntryState 包 装 之 后 ， 空 桶 (Vacant) 束 多 了 一 层 语 义 : 真正 的 空 
桶 和 值 随时 可 以 被 莹 换 的 桶 。 其 实在 此 处 也 体现 了 Rust 中 Enum 枚 淮 体 
的 方便 性 。 

如 果 在 线性 探测 过 程 中 找到 的 是 EmptyBucket， 那 么 就 将 其 包装 为 
NoElem 返回 ， 然 后 就 可 以 调用 NoElem 的 insert 方 法 将 值 直 接 插 入 。 如 果 
此 时 返回 的 是 FullBucket， 那 么 需要 判断 其 探 击 次 数 是 耕 比 当前 要 搬入 
的 键 值 对 的 探 训 次数 少 ， 如 果 少 ， 则 将 此 桶 中 的 值 包装 为 NeqElem 并 返 
加 | 。 


对 于 NeqElem， 其 包含 的 是 当前 FullBucket 中 存储 的 值 ，Rust 内 部 会 
使 用 robin_hood 方 法 用 新 的 值 将 其 将 换 反 。 符 换 反 的 值 当 然 不 能 扔 抒 ， 

而 要 绸 次 通过 线性 探测 为 其 找到 新 的 位 置 。 在 robin_hood 方 法 内 部 通过 
两 个 般 侠 的 loop 循 环 来 保证 新 什 和 符 换 挥 的 值 均 被 存储 到 合适 的 棚 中 。 

如 果 探 测 次 数 不 满 足 要 求 ， 那 么 比 对 “FullBucket ”中 存储 的 值 的 
Hash 值 是 否 和 search_hashed 方法 传 入 的 Hash 值 相 匹 配 ， 如 果 匹 配 ， 则 
册 比 对 存储 的 键 是 否 和 传 入 的 键 一 致 ， 如 各 一致 承 返 回 “ 请 棚 
(Occupied) ”. iwi (Occupied) 是 指 最 终 答 找到 的 和 指定 键 一 一 对 应 
的 桶 。 如 果 是 insert 操 作 ， 则 其 内 部 会 调用 std: : mem: : swap 方 法 用 
新 值 丛 换 挥 旧 值 。 如 果 是 get 操 作 ， 则 返回 访 棚 中 保存 的 值 。 

以 上 束 是 HashMap 的 整个 实现 思路 。 前 面 提 到 过 ， 开 放 定 址 法 的 一 
个 缺点 是 根据 指定 的 键 删 除 键 值 对 比较 复杂 ， 因 为 并 不 能 真 的 删除 ， 人 否 
则 会 破坏 寻 址 的 正确 性 ， 但 是 Rust 很 轻松 地 解决 了 这 个 问题 。 

当 使 用 HashMap 的 remove 方 法 删除 键 值 对 时 ， 同 样 需要 将 传 入 的 键 
通过 Hash 了 疯 数 计算 出 Hash 值 ， 人 然后 经 过 search_hashed 方 法 的 检索 ， 返 回 
满 桶 (如 果 没 有 找到 则 返回 None，〉， 再 调用 内 部 的 pop_internal 方法 对 
桶 进行 删除 处 理 。 但 这 个 删除 并 非 真正 的 删除 ， 而 是 通过 gap_peek 方 法 
返回 一 个 枚 举 类 型 GapThenFull， 如 代码 清单 8-62 所 示 。 

代码 清单 8-62: GapThenFull 枚 举 体 示意 


1. pub struct GapThenFull<K, V, M> { 
Bis gap: EmptyBucket<K, V; ()>, 

Sx Culle FUullBGekee<k. Ve M>; 

4. } 

使 用 GapThenFull 枚 举 体 来 表示 内 部 桶 的 两 种 状态 ， 束 完美 地 解决 
J 了 remove 的 问题 。 此 处 也 体现 了 Enum 的 强大 之 处 。 

在 了 解 了 HashMap 的 各 种 使 用 方法 及 其 实现 原理 之 后 ， 有 一 点 需 
要 注意 ， 在 使 用 HashMap 时 ， 如 果 要 合并 两 个 或 多 个 HashMap， 则 尽量 
使 用 extend 或 其 他 严 代 器 适 配 右 方式 ， 而 不 要 用 for 人 循环 来 搬入， 否则 会 
市 来 性 能 问题 。 


8.3 理解 容量 


无 论 是 Vec 还 是 HashMap， 使 用 这 些 集合 容 絮 类型， 最 重要 的 是 理 
解 容 量 (Capacity) 和 大 小 (Size/Len) 的 区 别 ， 如 图 8-11 所 示 。 
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图 8-11: 容量 和 大 小 的 区 别 

从 图 8-11 中 可 以 看 出 ， 容 量 是 指 为 集合 容 问 分 配 的 内 存 容 量 ， 而 大 
小 是 指 该 集合 中 包含 的 元 系数 量 。 也 就 是 说 ， 容 量 和 内 存 分 配 有 关系 ， 
大 小 只 是 衡量 该 集合 容 问 中 包含 的 元 系 。 当 容量 满 了 之 后 ， 这 些 集 合 容 
项 都 会 目 动 扩 容 。 但 是 对 于 不 同 的 集合 容 喜 ， 定 义 容量 满 或 空 两 种 状 
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僻 ， 即 便 是 Rust 这 种 亏 称 内 存 安全 的 语言 ， 也 无 法 避免 这 种 馆 辑 上 的 漏 
洞 。 

在 Rust 1.21 到 1.3 中 ，VecDeque 集 合 类 型 中 的 reserve 方 法 暴露 了 一 个 
缓冲 区 溢出 漏洞 出 ， 人 允许 任意 代码 执行 。 就 是 这 样 的 逻辑 漏洞 ， 本 质 
RA ett 了 容量 。 

Rusti] VecDeque< T > Fe AH AY SS AS Be HY ig KA CDouble- 
Ended Queue) ， 具 体 用 法 在 第 2 草 中 介绍 过 。 其 内 部 主要 维护 一 个 环形 
绥 冲 区 (Ring Buffer) ， 如 图 8-12 所 示 。 
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18-12: VecDeque 中 环形 缓冲 区 示意 图 

该 环形 缓冲 区 由 两 个 指针 和 一 个 可 增长 数组 组 成 。 这 两 个 指针 分 别 
为 头 指 针 (Head Pointer) 和 尾 指针 (Tail Pointer) 。 其 中 头 指针 永 
远 指 同 应 该 写 入 数据 的 位 置 ， 而 尾 指 针 水 远 指 同 可 以 读 取 的 第 一 个 元 
> 

以 图 8-12 为 例 ， 环 形 缓 冲 区 为 空 时 ， 两 个 指针 都 指 问 位 置 0。 当 有 
新 元 系 插 入 时 ， 如 果 和 直接 插入 位 置 0， 则 将 用 于 写 入 数据 的 Head 指 针 指 
问 位 置 1， 而 用 于 读 取 数据 的 Tail 指 针 依旧 指 回 位 置 0。 依 此 类 推 ， 当 插 
入 第 8 个 元 北 时 ，Head 和 Tail 指 针 将 再 次 重 登 。 那 么 在 这 种 情况 下 ， 议 
如 何 区 分 头 和 尾 ?” 如 来 这 时 继续 给 缓冲 区 添加 新 元 素 ， 那么 位 置 0 处 的 
数据 将 补 其 他 数据 履 新 ， 这 就 会 造成 缓冲 区 洲 出 攻击 o MA, J JI 
倪 这 种 情况 ， 需 要 空 出 一 个 位 置 ， 不 能 插入 元 和 又， 这 样 才 可 以 区 分 头 和 
Mee 
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创建 新 的 绥 冲 区 时 ， 目 动 你 留 一 位 ， 如 代码 清单 8-63 所 示 。 

代码 清单 8-63: VecDeque 二 TT 二 中 的 with_capacity 方 法 源码 


i- pub in With Gapacity (n: usizžze) -> VecDeque<T> 4 

a // 此 处 使 用 +1， 是 因为 ringbuffer 总 是 需要 预 留 一 个 空位 
ce let cap = ‘tips stax in + Ly MINIMUM CAPACITY # 1) 
4. next power of two(); 

De assert! (cap > n, “Capacity ovetflow")}; 

Gs VecDeque { 

Ta tails Qi 

in head: O, 

9. bufs RawVec: With capacity (cap) , 

L a } 

Lite 


代码 清单 8-63 展 示 了 VecDeque<T> 中 with_capacity 方 法 的 源码 ， 
注意 代码 第 2 行 的 注释 ， 在 初始 化 容量 cap 时 ， 束 已 经 考虑 了 全 少 你 留 一 
至 位 的 问题 。 
代码 第 3 行 ， 使 用 了 一 种 特别 的 算法 来 计算 要 分 配 的 容量 。 充 算法 
惑 是 next_power_of two 方 法， 表示 要 分 配 的 容量 必须 大 于 或 等 于 容量 
Bin 的 最 小 二 次 景 ， 比 如 传 入 的 mn 为 2， 则 分 配 容量 为 4。 这 是 一 种 出 于 
安全 考虑 的 优化 ， 如 果 传 入 的 容量 数 洲 出 ， 则 容量 值 会 运 回 0, Hatz 
不 预 分 配 内 容 。 
所 以 ， 要 判断 环形 绥 剖 区 十 否 为 满 状 态 ， 融 必须 看 容量 和 大 小 的 差 
是 否 为 1， 如 代码 清单 8-64 所 示 。 
代码 清单 8-64: VecDeque <T> t} is _full iV 
Ls En 15 _full(é&self) -> bool { 
Bic self.cap() - self.len() == 
Soy } 
代码 清单 8-64 展示 了 VecDeque<T> His full 方法 的 源码 ， 该 方法 
用 于 判断 容 硕 是 售 为 满 状 态 。 可 以 看 出 ， 讽 方法 满足 预期 要 求 。 
接 下 来 看 看 皮 出 CVE 的 原始 代码 ， 如 代码 清单 8-65 所 示 。 
代码 清单 8-65: VecDeque 二 TT 二 中 出 现 安全 漏洞 代码 


l. pub fn reserve(é&mut self, additional: usize) { 

2 Let old cap = seliecapi);? 

3 let used cap = selr.teni) t ly 

4. let new cap = used cap.checked add(additional) 

Bis And then ( 

6 needed. cap| needed cap.checked next power of two() 
7 ) .expect ("Capacity overflow"); 

8 if new cap > self.capacity() { // 问题 代码 


self .pDuT. reserve exact (used cap, new Cap - used Cap) ; 


LY; unsafe { 

Lie self. handle cap increase (old cap); 
Le } 

LB } 

14. } 


代码 清单 8-65 展 示 了 出 现 安全 漏 铜 代码 的 reserve 方 法 。 充 方法 一 般 
用 来 为 集合 容器 生成 指定 的 更 多 的 容量 ， 这 样 可 以 避免 容 占 频繁 扩容 。 
但 是 该 方法 的 第 8 行 犯 了 一 个 致命 的 错误 。 

代码 第 8 行使 用 了 capacity 方 法 来 判断 容量 。 但 是 在 VecDeque 雪 工 > 
中 ，capacity 方 法 用 于 给 开发 者 展示 可 用 的 馆 辑 容量 ， 而 cap 方 法 展示 的 
才 是 真正 的 物理 容量 ， 它 们 之 间 的 关系 是 cap=capacity+1 ， 因 为 环形 组 
冲 区 必须 保留 一 个 空位 。 所 以 ， 这 里 使 用 capacity 方 法 判断 容量 会 导致 
容量 分 配 少 一 位 。 如 末 容 量 少 分 配 一 位 ， 那 么 在 读 与 数据 的 过 程 中 ， 指 
针 还 是 按 cap ”表示 的 真实 容量 来 计算 ， 最终 的 后 果 束 是 本 来 空 出 的 一 
位 ， 也 锌 写 入 了 了 数据。 这样 束 出 现 了 本 市 开始 提 到 的 情况 ， 指 针 针 乱 。 
在 这 种 情况 下 ， 如 果 再 写 入 新 的 数据 ， 束 会 产生 缓冲 区 洲 出 攻击 的 风 
Ko 

这 个 漏洞 修复 起 来 也 很 徐 单 ， 只 需要 将 第 8 行 改 成 <“jf new_cap> 
old_cap{” 即 可 。 其 中 old_cap 才 是 真实 的 容量 。 

通过 这 个 采 例 我 们 了 解 到 ， 容 量 不 仪 仪 是 指 “ 物 理 * 上 的 内 存 容 量 ， 
还 包括 由 相应 数据 结构 特性 产生 的 “他 辑 ”容量 。 在 日 党 开发 中 ， 需 要 注 
RIA aL, Wee S| A ae lal o 


8.4 小 结 


字符 串 是 一 门 编程 语言 必 不 可 少 的 类 型 ，Rust 出 于 内 存 安 全 的 考 
谍 ， 将 字符 串 划 分 为 儿 种 相互 配对 的 类 型 ， 其 中 最 稼 用 的 是 &str 和 
String 关 型 的 字符 串 。&str 代 表 的 是 不 可 变 的 字符 串 ， 这 里 不 可 变 的 恕 
思 是 指 ， 这 种 奖 型 的 字符 串 是 一 个 不 可 变 的 整体 ， 无 法 对 其 中 的 单个 字 
从 进行 任意 操作 (引起 整个 字符 串 发 生变 化 )。&str 类 型 的 字符 串 可 以 
锌 存储 在 栈 上 ， 也 可 以 被 存储 在 堆 上 ， 还 可 以 被 存储 在 表态 区 域 。 而 
String 代 表 的 是 可 变 的 字符 串 ， 其 只 能 被 存储 在 堆 上 。 可 变 是 指 String 字 
从 串 中 的 单个 字符 可 以 随时 被 增 、 删 、 改 。 

在 对 Rust 中 的 字符 和 字符 串 进 行 操作 时 ， 最 好 按 字 从 来 进行 操作 ， 
因为 Rust 中 的 字符 串 内 部 存储 的 都 是 UTF-8 字 节 序 列 ， 如 果 按 字 贡 进行 
操作 ， 那 么 在 某 些 情况 下 会 出 现 问 题 。 并 且 和 字符 串 也 不 文 持 按 索引 来 访 
问 其 中 的 字符 ， 如 果 要 操作 字符 串 中 的 字符 ， 则 需要 使 用 友 代 的 方式 。 

不 管 是 什么 次 型 的 字符 串 ， 都 文 持 标准 库 中 提供 的 字符 串 检 索 匹 配 
方法 ， 只 要 实现 了 Pattern<′a> 的 类 型 ， 孢 均 可 作为 匹配 参数 。 比 较 
种 用 的 方法 有 contains、trim、trim_matches、matches、find 等 。 因 为 Rust 
并 没有 内 置 正 则 表达 式 引 人 擎 ， 所 以 使 用 这 些 字 符 吕 匹配 方法 也 是 一 种 选 
择 。 在 实际 项 目 开 发 中 ， 可 以 使 用 官方 提供 的 正则 表达 式 引 擎 regex 包 
来 文 持 正则 匹配 。 

实际 上 ，&str 和 String 均 为 动态 大 小 类 型 (DST) 。 字 符 串 切片 &str 
和 数组 切片 是 类 似 的 ，String 是 对 Vec<u8> 的 包装 。 所 以 ， 字 符 串 的 某 
些 方法 和 数组 类 型 (array 和 Vector， 以 及 slice) 是 通用 的 ， 比 如 
with_capacity， 不 管 是 String 字 符 串 还 是 Vector 数组 ， 均 可 通过 此 方法 来 
了 预 分 配 推 内存。 但 是 数组 也 有 其 独 有 的 方法 ， 比 如 实现 了 Index， 可 以 
按 索 引 访问 数组 中 的 值 。Rust 标 准 库 也 为 数组 提供 了 方便 、 高 效 的 排序 
和 检索 方法 。 

除数 组 之 外 ， 本 章 还 重点 介绍 了 HashMap 类 型 。 在 Rust 中 ， 只 有 实 
现 了 Eq 和 Hash 的 类 型 才 可 以 当 作 HashMap 的 键 ， 所 以 译 点 数 无 法 直接 作 
为 HashMap 的 键 。 但 是 不 妨碍 开 及 者 通过 NewType 模 式 对 序 点 数 进行 包 
疾 来 实现 将 其 作为 键 。 


HashMap 只 实现 了 Index， 而 没有 实现 IndexMut， 所 以 只 能 用 索引 语 
法 碍 找 键 值 对 ， 而 无 法 插入 或 修改 键 值 对 。 但 是 Rust 标 准 库 另 外 提供 了 
Entry 模 式 来 帮助 开发 者 方便 操作 和 键 值 对 。 如 果 和 需要 合并 HashMap， 则 可 
以 使 用 extend 或 其 他 过 代 闫 适配器 来 完成 ， 尺 量 不 要 使 用 for 循 环 将 一 个 
HashMap 插 入 为 一 个 中 。 

本 章 介 绍 了 HashMap 的 内 部 实现 。 我 们 知道 Rust 使 用 开放 定 址 法 来 
解决 Hash 冲 突 ， 并 使 用 罗宾汉 香 法 来 解决 聚集 问题 。 当 负载 因子 达到 
0.9 的 时 候 ，HashMap 会 目 动 扩容 ， 以 保证 容纳 更 多 的 键 值 对 。 通 过 了 解 
HashMap 的 内 部 实现 ， 我 们 可 以 学 习 到 一 些 实 用 的 开发 扩 巧 ， 比 如 利用 
Enum 来 解决 remove 键 值 对 的 问题 。 

本 间 最 后 还 分 析 S VecDeque<T> Preserve Ù ALR HY CVE YR YF], 
BRAVA S ØRER EE A ee, PS SILA A 
jel: Rust 昌 然 可 以 保证 内 存 安 全 ， 但 无 法 保证 志和 辑 安 全 。 这 是 需要 每 个 
Rust 开 发 者 注意 的 地 方 。 

在 std: : collection 中 还 提供 了 很 多 其 他 集合 类 型 ， 比 如 LinkedList 
<T>. BinaryHeap<T>. BTreeMap<T>. HashSet<T> fll BTreeSet 
<T>. RFA, KERA ENWOL NTA, Rust JE% y} E 
一 至 性 的 语言 ， 在 这 些 集 合 类 型 操作 方法 的 命名 上 ， 和 Vec<T> 或 
HashMap<K，V> 都 是 一 致 的 ， 可 以 通过 得 阅 标准 库 文 档 目 行 学 习 理 
解 。 总 的 来 说 ，Rust 实 现 的 这 些 集合 类 型 及 其 相关 操作 方法 ， 都 是 从 高 
性 能 和 市 省 内 存 方 问 来 考 铺 的 ， 毕 葛 Rust 的 目标 之 一 是 系统 级 语言 。 
Rust 还 在 不 断 的 进化 中 ， 标 准 库 提 供 的 这 些 集合 类 型 还 未 达到 最 优 ， 在 
不 久 的 将 来 ， 它 们 会 更 加 完善 。 





[1] CVE-2018-1000657. 


第 9 章 构建 健壮 的 程序 


每 个 人 都 有 错 ， 但 只 有 轧 者 才 会 执迷不悟 。 

TSK, FEAT ZI, HARER, PARE SRT; 一 栋 大 
校 ， 在 地 震 来 临 之 际 ， 可 以 吸收 震 力 ， 电 芯 不 倒 ， 一 套 软 件 系统 ， 在 弄 
币 出 现 之 时 ， 可 以 阻止 朋 吝 ， 稳 定 运行 。 这 吏 是 健 半 性。 健壮 性 是 指 系 
统 在 一 定 的 内 外 部 因 系 的 扰动 下 ， 仍 然 可 以 维持 其 结构 和 功能 的 稳定 
性 。 健 壮 性 ， 是 你 证 系统 在 弄 单 和 危险 情况 下 生存 的 关键。 

健壮 性 又 叫 鲁 标 性 〈Robust) 。 重 棒 性 是 一 个 路 领域 的 术语 ， 在 建 
沉 、 机 械 、 控 制 、 经 济 和 计算 机 领域 均 意 味 痢 系统 的 容错 和 恢复 能 力 。 
MKP EREE AE TOR AY) a AR EE Ay EL A BS EY SS 
{RAY Hes Aly E Fa PE sk IP TT TE RE SE Po, AT A ee TL, 
Sr he TEETER EZ. MEPL, BEER Rt BAD 
Be OR BE SHAE E M a LW KER, (ABE ARER AL FB Dd A) 
依赖 程度 越 来 越 深 ， 其 市 来 的 破坏 力 会 越 来 越 严 重 。 

纵 观 软件 开 友 的 历史 ， 为 了 保证 软件 的 健壮 性 ， 各 门 语言 所 用 的 办 
法 各 有 特色 ， 但 妃 归 可 以 分 为 两 大 类 : JRE ASE AY o 

比如 在 C 语 言 中 ， 并 不 存在 专门 的 寞 第 处 理 机 制 ， 开 友 者 只 能 通过 
返回 值 、goto、setjump、assert 断言 等 方式 来 处 理 程序 中 发 生 的 错误 ， 
这 些 方 去 的 优点 是 比较 灵活 ， 但 征 缺点 更 多 。 第 一 ， 这 种 铬 误 并 不 生 强 
制 性 检 否 的 ， 很 容易 梓 开 有 发 者 路 色 而 进一步 引起 更 多 的 问题 ， 成 为 Bug 
的 多 床 ;第 二 ， 可 读 性 过， 销 误 处 理 代 码 和 正 芝 的 功能 代 但 交织 在 一 
起 ， 有 可 能 会 让 正常 逻辑 陷入 混乱 中 ， 有 人 称 之 为 “错误 地 狱 ”。 

随 厦 C++、Java 等 局 级 语言 的 有 友 展 ， 引 入 了 语言 级 别 的 卉 党 处 理 机 
制 ， 才 让 开发 者 摆脱 了 “错误 地 狱 ?。 异 党 处 理 机 制 利 用 栈 回 退 (Stack 
Unwind) 或 栈 回 洲 (Stack Backtrack) 机 制 ， 自 动 处 理 异 党， 解放 了 
FRÉ. Fe THAN Ti ee cee A, AN BEAT A AY PR SS 
RET ORE AY» HHE TIEA es A Es A eT 
HWP PIP (Ae aS AHP ANSE. Hw EAS ARENT a ERK, 
尤其 是 在 抛 出 异常 时 ; KHR, FAR AS, OTP ACER 


Db» SUA) CAE tes CH EFT oe Fy AS, SC RMA Ped 

Rust 作 为 一 门 现代 安全 的 系统 级 编程 语言 ， 如 何 构建 健壮 的 程序 是 
其 必然 要 解决 有 的 问题 之 一 ， 而 工程 性 、 安 全 性 和 性 能 是 其 必须 要 考虑 的 
三 重 标 准 。 


9.1 通用 概念 


在 编程 中 过 到 的 非 正常 情况 ， 大 概 可 以 分 为 三 类 : 失败 
(Failure) 、 和 错误 (Error) 和 异常 (Exception) . 

失败 wets FRAP ATA HEAR“ SRA)” AR de is AE PEP IE 
WIS TT ABU EAR TE EUA PRI BITE FE MIN PL FE Wh I A RRA NS 
数 和 返回 荣 种 闫 型 的 仁 ， 这 天 创建 了 一 个 契约 ， 在 调用 该 函数 时 ， 需 要 
满足 此 “契约 ? 才 是 程序 正确 运行 的 前 所 条 件 。 

Bix 是 指 在 可 能 出 现 问题 的 地 方 出现 了 问题 。 比 如 建立 一 个 HITP 
连接 时 超时 、 打 开 一 个 不 存在 的 文件 或 得 询 有 未 些 数 据 时 返回 了 空 。 这 些 
都 是 完全 在 意料 之 中 ， 并 且 有 办 法 解决 的 问题 。 而 且 这 些 问题 通常 都 和 
基体 的 业务 相关 联 。 

弄 间 ”是 指 完 全 不 可 预料 上 的 问题 。 比 如 引用 了 空 指针、 访问 了 越界 
数组 、 除 数 为 零 等 行为 。 这 些 问 题 是 非 业 务 相 关 的 。 

很 多 文 持 异 第 处 理 的 语言 ， 比 如 C++. Java, Python 或 Ruby 等 ， 
并 没有 对 上 述 三 种 情况 做 出 语言 级 的 区 分 。 这 束 叶 致 很 多 开发 者 在 处 理 
异常 时 把 一 切 非 正 党 情况 都 当 作 寞 第 来 处 理 ， 其 至 把 寞 沼 处 理 当 作 控制 
流程 来 使 用 。 把 一 切 非 正和 常情 况 都 当 作 寞 弟 来 处 理 ， 不 利于 管理 。 在 开 
发 中 很 多 错误 需要 在 第 一 时 间 束 葵 露 出 来 ， 才 不 至 于 传播 到 生产 坏 境 中 
进一步 造成 危害 。 有 些 开 发 者 里 然 对 异 遇 的 三 种 情况 做 了 不 同 的 处 理 ， 
比如 对 错误 使 用 返回 值 的 形式 来 处 理 、 对 真正 的 寞 党 使 用 异 当 机制 来 处 
理 ， 但 是 却 并 没有 形成 统一 的 标准 ; 社区 里 只 有 最 佳 实践 在 口 口 相传 ， 
但 并 非 强 制 性 执行 。 

现代 编程 语言 Go 在 语言 层面 上 区 分 了 肛 币 〈Panic) 和 铺 误 ， 但 十 
市 来 了 巨大 的 和 争议。 在 Go 语言 中 错误 处 理 是 强制 性 的 ， 开 及 人 员 儿 须 
显 式 地 处 理 铺 误 ， 这 了 束 导 致 Go 语言 代码 变 得 相当 元 长 ， 因 为 每 次 函数 
调用 都 需要 if 语句 来 判断 是 侣 出 现 错误 。Go 语言 错误 处 理 的 理念 很 
好 ， 但 是 具体 实现 却 差 吕 人 意 。Rust 语 言 也 区 分 了 异 稍 和 错误 ， 但 相 比 
于 Go 语言 ，Rust 的 错误 处 理 机 制 束 显得 非常 优雅 。 


9.2 消除 失败 


Rust 使 用 以 下 两 种 机 制 来 消除 失败 : 
“ 强大 的 类 型 系统 。 


Rust 是 类 型 安全 的 语言 ， 一 切 首 类 型 。Rust 中 的 函数 签名 部 显 式 地 
指定 了 类 型 ， 通 过 编 详 占 的 类 型 检查 ， 束 完全 可 以 消除 函数 调用 违 
及 “四 约 ”的 情况 ， 如 代码 清 蛙 9-1 所 示 。 

代码 请 单 9-1: 依赖 类 型 检查 消除 错误 


il fm Suma: 132, Do 232) => 132 í 
2 a + DB 

cP } 

4 fn main() { 

A Swi (1 和， Z032? 

=M } 


{VS 9-1 F jE X A sum A 2 m Bt AY BS N32, M Æmain 
函数 中 传 入 的 参数 类 型 为 u32， 编 译 器 在 编译 期 就 能 检查 出 来 这 种 违 
RRA Woo, Tee P: 

error[E0308]: mismatched types 
9 | sum{tiwu3szZ, 20u32}; 


| NNNA 


expected i132, found u32 

2a PE as HY Fe Pe te THE is Ae, BA a DR AC 9 sum PR a ig 22 YY 
是 让 2 类 型 ， 但 是 发 现 了 u32 类 型 ， 类 型 不 匹配 。 

仪 仅 依 赖 编 译 如 的 类 型 检查 还 不 足以 消除 大 部 分 失败 ， 有 些 失 败 会 
发 生 在 运行 时 。 比 如 Vector 数组 提供 了 一 个 insert 方法 ， 通 过 该 方法 可 
以 为 指定 的 索引 位 置 插 入 值 ， 如 代码 清早 9-2 所 示 。 

代码 清单 9-2: Vec< 工 > 类 型 的 insert 方 法 使 用 示例 


fn main() { 
let mut vec = vec! [1, 2, 3]; 


vec.insert(l, 4); 


1 
2 
3 
a aSsert eg. (vE; [ls 4y Zr 3))F 
a vec.insert(4, 5): 
6 assert eg: (vec; [ly 4y ar Sy 5J); 
Ta // vec.insert(8, 8); 
8. } 

在 代码 清单 9-2 中 展示 的 insert JAW — TASOT ERIR A 
置 ， 第 二 个 参数 为 要 插入 的 值 。 代 码 第 3 行 和 第 5 行 ， 指 定 的 索引 位 置 是 
合法 的 ， 因 为 均 小 于 竺 插入 数组 的 长 度 。 但 是 代码 第 7 行 会 引发 线程 式 
个 ， 因 为 给 定 的 索引 位 置 并 不 存在 ， 超 过 了 数组 的 长 上 度 。 

对 于 代码 第 7 行 所 示 的 这 种 情况 ， 通 过 类 型 检 栓 是 无 法 判断 的 ， 
为 无 法 预先 知道 开发 者 会 指定 什么 索引 。 这 时 惑 需 要 使 用 瞩 言 
(Assert) 。Rnust 标 准 库 中 一 共 提 供 了 以 下 六 个 间 用 的 呵 言 : 

assert! ， 用 于 断言 布尔 表达 式 在 运行 时 一 定 返 回 true。 

-assert_eq! ， 用 于 断言 两 个 表达 式 是 售 相 等 《使 用 PartialEq) 。 

-assert_ne! ， 用 于 上 断言 两 个 表达 式 是 否 不 相等 〈 使 用 PartialEq) 。 

. debug_assert! ， 等 价 于 assert! ， 只 能 用 于 调试 模式 。 

-debug_assert_eq! ， 等 价 于 assert eq! ， 只 能 用 于 调试 模式 。 

-debug_assert_ne! ， 等 价 于 assert_ne! ， 只 能 用 于 调试 模式 。 

以 上 六 个 断言 都 是 宏 。assert 系 列 安 在 调试 (Debug) 和 发 布 
(Release) 模式 下 均 可 用 ， 并 且 不 能 被 禁 用 。debug_assert 系 列 宏 只 在 
调试 模式 下 起 作用 。 在 使 用 断言 时 ， 要 注意 有 具体 的 场合 是 人 否 一 定 需 要 
assert 系列 宏 ， 因 为 断言 的 性 能 开销 不 可 忽略 ， 请 尽量 使 用 debug_assert 
AME o 

所 以 ， 对 于 代码 清单 9-2 中 用 到 的 insert 方 法 ， 可 以 使 用 assert! 断言 
来 消除 可 能 指定 非法 索引 而 造成 插入 失败 的 情况 ， 如 代码 清单 9-3 所 
不 。 

代码 清单 9-3: 在 insert 方 法 中 使 用 assert! Ws 


1 pub fn insert(&mut self, index: usize, element: T) { 
2 let len = self.len(); 

Fa assert! (index <= len); 
4 

5 


} 
Mis 419-3 AN T AA Vec<T>% ae 注意 代码 
第 3 行 ， 使 用 assert! 上 断言 来 判断 指定 的 色 引 index 一 定 小 于 或 等 于 数组 的 
长 度 len， 如 果 传 入 了 超过 len 的 索引 值 ， 则 该 判断 表达 大 趟 会 返回 false 
此 时 assert! FR 5| RARER. 


S| Ae Be eek ie aA RAIS? 这 其 实 是 一 种 快速 失败 (Fast Fail) 
的 案 略 ， 这 样 做 可 以 让 开 友 中 的 和 PURRE LK, IE fF Bug Tc AL JER 
号 。 所 以 assert 系 列 宏 也 文 持 目 定义 错误 消息 ， 如 代码 请 单 9-4 所 示 。 
代码 清单 9-4: Axe Cri 
fn main() { 

let x = false; 

assert! (x, “x wasn't true!™); 

let a = 3; let b = 28; 

debug assert! (a + D == 30, "a = {}, Ð = {}]"; ay DB)? 


a Ohm WwW N 全 


} 
在 代码 清单 9-4 中 ， 代 码 第 3 行 和 第 5 行 均 会 引发 线程 名 懂 ， 但 是 在 
线程 恕 屋 的 时 候 会 输出 指定 的 消 号 ， 便 于 开 友 者 修正 错误 。 

Se EAA, We Ss 可 以 对 函数 进 和 TRIAR. HIR RA W 
是 指 可 以 确保 程序 正常 运行 的 条 件 ， a > BURR H 
了 Bug。 程 序 运 行 的 条 件 大 概 可 以 分 为 以 下 三 

HU ELAR : 代码 执行 之 前 必须 具备 的 特性 
MAR: 代码 执行 之 后 必须 具备 的 特性 。 
前 后 个 变 : 代码 执行 前 后 不 能 变化 的 特性 。 
在 日 第 开 友 中 ， 如 果 必 要 的 话 ， 则 可 以 依据 这 三 类 迟 况 来 设置 断 


除 断 言 之 外 ， 还 可 以 直接 通过 ”panic! BRIAR, KEE 
assert 系列 宏 内 部 也 使 用 了 panic! 安 。 那 么 什么 时 候 使 用 呢 ? 其 实 还 是 


遵循 快速 失败 的 原则 ， 在 处 理 某 些 在 运行 时 绝 不 允许 或 绝 不 可 能 发 生 的 
情况 时 ， 可 以 使 用 panic! 安 。 


9.3 7 ADT Ta 


Rust 提 供 了 分 层 式 错 谋 处 理 方 采 : 

-Option<T> ， 用 于 人 处理 有 和 无 的 情况 。 比 如 在 HashMap 中 指定 
一 个 键 ， 但 不 存在 对 应 的 值 ， 此 时 应 返回 None， 开 发 者 应 该 对 None 进 
AT RADA ARS, TD NE BEG PARE ES ie o 

-Result<T, E> ， 用 于 处 理 可 以 合理 解决 的 问题 。 比 如 文件 没有 
找到 、 权 限 补 拒绝、 字符 串 解 析出 错 等 错误 。 

| Ree he (Panic)  ， 用 于 处 理 无 法 合理 解决 的 问题 。 比 如 为 不 
ATEN AR SIA, PDAS aE. TEER, WIRE EATS 
HR T Behe the, VW eae ay H Re ee DASE SR HAR HEE, tee 
REH IR o 

:程序 中 止 (Abor) ， 用 于 处 理会 发 生 灾 难 性 后 果 的 情况 ， 使 用 
abort 函数 可 以 将 进程 正 间 中止。 

Rust 的 错误 处 理 方 案 来 产 于 图 数 却 语言 《比如 Haskell) ， 不 仅仅 区 
分 了 错误 和 腊 帅 ， 而 且 将 错误 更 进一步 区 分 为 Option<T #llResult< 
T，E>。 使 用 和 类 型 Enum， 使 得 基于 返回 值 的 错误 处 理 粒 度 更 细 、 更 
MEIE. ÆRust H, RIER E ee ical xe eA o 


9.3.1 4) 4 B Option<T> 


Option 二 T 二 类 型 属于 枚 举 体 ， 包 括 两 个 可 选 的 变 体 : Some (T) 
和 None 。 作 为 可 选 值 ，Option<T > 可 以 被 使 用 在 多 种 场景 中 。 比 如 可 
选 的 结构 体 、 可 选 的 函数 参数 、 可 选 的 结构 体 字 段 、 可 至 的 指针 、 占 位 
(如 在 HashMap 实 现 中 解决 remove 问 题 ) 等 。 

Option 过 TT 二 类 型 在 日 党 开 友 中 非常 弟 见 ， 它 基本 上 消除 了 空 指针 
问题 ， 如 代码 清单 9-5 所 示 。 

代码 清单 9-5: Option 二 TT 二 使 用 示例 


ln TH GEE ShOMTest (MANEESI VEeccistr>) -> Optien<estr> f 
Bie if names.len() > O | 

Jy let mut shortest = names[0]; 

4, for name in names.iter() { 

Biss if name.len() < shortest.len() { 

Gs shortest = *name; 

Ty } 

Si. } 

9.. Some (shortest) 

i, } else { 

Ils None 

Lgs } 

l3. } 

i4. fn. show shortest({(names: Vecs&str>) -> tm 1 

13s match get shortest(names) { 

LS. Some (shortest) => shortest, 

4 None => "Not. Found”, 

LS w } 

Ts J 

20s TR WML) 4 

ae desert 6g. (Show Saoriest(vee! "UKU; "Palipe* |), "UKSI 
ce assert eq! (show shortest.(Vee:snew()), "Not Found”); 
Aoa d 


FEARS 9-5 E X Y get_shortest KH žit, 2A Vec<&str> MA, 
得 到 其 中 长 度 最 短 的 字符 串 。 在 实现 该 图 数 时 ， 需 要 考虑 : 如 果 传 入 的 
是 空 数组 怎么 办 ? AAA SB, FTE BAAN, WRNE 
ANOS, Be Ae S| RAE B EAA Optin<T>, TAHR 
9None， 非 空 数 组 返回 Some。 显 然 第 二 种 处 理 方式 好 过 第 一 种 ， 因 为 
对 于 这 种 问题 ， 不 处 理 巡 得 函数 行为 不 统一 ， 引 及 线 程 嫩 慨 则 显得 小 题 
Kil. ATLA, get_shortest ek 2a iš [2] Option< &str> KH. 

代码 第 14 一 19 行 ， 定 义 了 show_shortest 方 法 ， 内 部 调用 
get_shortest， 并 使 用 match 匹 配 来 处 理 该 函数 返回 的 Option<&str>。 如 
末 是 Some， 则 返回 其 内 部 的 字符 串 ;， 如 条 是 None， 则 返回 固定 的 字符 


“Not Found”。 这 样 在 main 哨 数 中 调用 show shortest 方 法 时 ， 则 可 以 得 
到 预料 中 的 结 

unwrap 系 列 方法 

看 得 出 来 ， 在 代码 清单 9-5 中 使 用 Option< 工 > 保证 了 代码 的 基本 
健壮 性 。 除 使 用 _ match 匹配 之 外 ， 标 准 库 中 还 提供 了 unwarp 系 列 方 法 ， 
如 代码 清单 9-6 所 示 。 

代码 清单 9-6: 使 用 unwrap 系 列 方法 


ES Vec<astr>) ~> aby 4 

2 // get shortest (names) .unwrap () 

3 get shortest (names), unwrap or("Not Found") 

4 // get shortest (names) .unwrap or else(|| "Not Found") 

5. // get shortest (names) .expect ("Not Found") 

Ge J 

7 fn main() { 

8 assert Go! (enow esnorcest vec: [Uy "Felipe" |}, TURU") 
9 ASSErU Gol (show ShorcreéL.(Vecitnew()), “Not. Found”) 7 


ls 

在 代码 清单 9-6 中 展示 了 unwrap、unwrap_or 和 unwrap_or_else 三 个 方 
法 。 其 中 unwrap 方 法 可 以 取出 包含 于 Some 内 部 的 什 ， 但 是 过 到 None 
就 会 引发 线程 恐慌 。 所 以 ， 当 show_shortest 函 数 传 入 室 数 组 时 ， 代 码 第 
2 行 所 示 的 写法 会 引用 线程 恐 惰 。 

代码 第 3 行使 用 的 unwrap_or 方 法 实际 上 是 对 match 匹 配 包装 的 语法 
糖 ， 广 方法 可 以 指定 处 理 None 时 返回 的 值 。 访 行 指定 了 字符 串 “Not 
Found”， 节 终 效果 等 价 于 代码 清单 9-5。 

代码 第 4 行使 用 的 unwrap_or_else 方法 和 unwrap_or 类 似 ， 只 不 过 
它 的 参数 是 一 个 FnOnce () ->TH. 

代码 第 5 行 展示 了 expect 方 法 ， 访 方法 会 在 过 到 None 值 时 引发 线程 
了 芍 忆 ， 并 可 通过 传 入 参数 来 展示 指定 的 异 第 消息 。 

在 日 党 开发 中 可 以 根据 具体 的 需求 选择 适合 的 unwrap 系 列 方法 。 
unwrap 方 法 适合 在 开发 过 程 中 快速 失败 ， 提 早 又 露 Bug， 如 果 要 目 定 义 
异常 消息 ， 则 可 以 使 用 expect。 对 于 明显 需要 处 理 None 的 情况 ， 则 可 以 


直接 使 用 match， 但 是 使 用 unwrap_or 或 unwrap_or_else 可 以 让 代码 更 加 简 
党 。 

Fy MA FE Option<T> 

在 大 多 数 情 况 下 ， 需 要 使 用 Option<T> 中 包含 的 值 进行 计算 ， 有 有 
时 候 只 需要 单 步 计 算 ， 有 时 候 则 需要 连续 多 步 计 算 。 如 条 把 Option<T 
> 中 的 值 通过 unwrap 取 出 来 再 去 参与 计算 ， 则 会 多 出 很 多 校 验 代 人 码 ， 比 
如 判断 是 否 为 None 值 。 如 果 使 用 match 方法 ， 则 代码 显得 比较 元 余 ， 如 
代码 清单 9-7 所 示 。 

代码 清单 9-7: 使 用 match 匹 配 来 操作 Option 到 工 > 

fh get shortest lengti(namesi WERE -> Option<usize> 4 
match get shortest (names) | 
Some (Shortest) => Some(shortest.len()), 


None => None, 


fn main() { 
assert eq! (get shortest length(vec! ["Uku","Felipe"]) ,Some(3) ); 
assert eg: (get shortest length (Veci tnew()), None) ; 
Be 

在 代码 清单 9-7 中 定义 了 get_shortest_length 方 法 ， 用 来 获取 数组 中 最 
短 字 符 串 的 长 度 。 代 码 第 2 行 ， 通 过 match 匹 配 get_shortest 方 法 返回 的 
Option<&str> 来 进行 计算 ， 如 果 是 Some， 则 调用 内 部 值 shortest 的 len 方 
法 得 到 长 度 ， 然 后 再 用 Some 将 其 包 闻 并 返回 :如 有 未 征 None， 则 继续 返 
加 None。 使 用 match 来 处 理 也 保证 了 健壮 性 ， 但 是 代 码 看 上 去 显得 非 钊 
风 余 。 在 标准 库 std: : option 模块 中 ， 还 提供 了 map 系 列 方法 来 改善 这 
种 情况 ， 如 代码 清单 9-8 所 示 。 

代码 清单 9-8: 使 用 map 来 操作 Option 到 工 > 


le £A Get shortest length (haiies: Vecsasir>) -> UOprlonsUsize> 1 
2 get shortest (names) .map(|name| name..ten({) ) 
3. J 
4. fn main() { 
5 assert ai (get shorrest length (vec: | Uku" "Felipe" |), sone (3)') 7 
0 assert eq! (get shortest length(Vec::new()), None); 
ie J 

在 代码 清单 9-8 中 使 用 了 map 方 法 ， 相 比 于 代码 请 单 9-7 中 的 写法 ， 
代码 瞬间 变 得 更 加 简洁 。 实 际 上 ，map 方 法 是 对 match 匹 配 的 包装 ， 其 有 具 
体 实 现 如 代码 清单 9-9 所 示 。 

代码 清单 9-9: std: : option: : Option: : map 方 法 的 具体 实现 
1 pub fn map<U, F? FnOnce(T) => U>(self, £: F) => Option<U> { 
2 match self 
cP Some (x) => Some(f(x)), 
4 
9 
6 


None => None, 


} 

从 代码 清单 9-9 中 可 以 看 出 ，map 是 一 个 泛 型 方法 ， 内 部 是 一 个 
match 了 叱 配 ， 对 于 Some 和 None 分 别 做 了 相应 的 处 理 ， 并 用 诅 方 法 的 参数 
为 FnOnce (T) -之 U 财 包 。 通 过 map 方 法 束 可 以 在 无 须 取出 Option 二 TT 二 
值 的 情况 下 ， 方 便 地 在 Option<T>> 内 部 进行 计算 。 像 map 这 样 的 方法 ， 
叫 作 组 合子 CCombinator) 。 

除 map 方 法 之 外 ， 还 有 map_or 和 map_or_else 方 法 ， 它 们 跟 map 方 法 
类 似 ， 都 是 对 match 的 包装 ， 不 同 的 地 方 在 于 ， 它 们 可 以 为 None 指定 默 
认 值 〈 回 想 一 下 unwrap_or 和 unwrap_or_else) 。 

在 有 些 情况 下 ， 只 苇 map 方 法 还 不 足以 满足 需要 。 比 如 对 Option<T 
> 中 的 T 进 行 处 理 的 图 数 退 回 的 也 是 一 个 Option<T > 之， 如 末 此 时 用 
map， 有 就 会 多 包装 一 层 Some。 假 如 现在 要 对 一 个 浮 点 数 进 行 一 系列 计 
T, ERTER: inverse 【〔 和 从 号 取 反 ) ~ double (加倍 
) 、log CKU 2 为 搬 的 对 数 ) ~ square (平方 )、sqrt ( 开 方 ) 。 
在 这 些 计 算 函 数 中 ， 求 对 数 和 开 方 的 计算 有 可 能 出 现 异 党 值 ， 比 如 对 儿 
数 求 对 数 和 开 方 都 会 出 现 NaN ， 所 以 这 两 个 计算 函数 的 返回 值 一 定 是 


Option 过 TT 二 类 型 ， 如 代码 清单 9-10 所 示 。 
代码 清单 9-10: map 和 and_then 共 用 示例 


fn double (value: £64) -> £64 { 
value * 2. 


上 一 


fn square (value: £64) -> f64 { 
value.powi(2 as 132) 


Fh 
器 


inverse(value: £64) -> £64 { 


value * -l. 


KS FF O Oss oO OO e U WN 
eer 


0. fn log (value: £64) -> Option<fe4> { 
if match value.log2() { 
1? X Lf £.48 nermal() => Sene(s) , 
LS a = => None 
14. } 
Lise g 
16. fn sqrt(value: £64) -> Option<f64> { 
Lad a match value.sqrt() i 
18 x TT xis normal() => Some (x), 
ine 7 => None 
oad } 
Bk ge 
a TH main tf) 4 
cn P let number: £64 = 20.; 
24. let result = Option::from(number) 
wD .map (inverse) .map (double) .map (inverse) 
20% ,and then(log).map(square).ana then (sqrt) ; 
ae FF match result { 
A « Some (x) => printin! ("Result was {}.", x), 
oo. None => printin! ("This failed. ™) 
Fa } 


Bla J 


在 代码 清单 9-10 中 ， 代 码 第 1 一 9 行 ， 分 别 定 义 了 double、square 和 
invVerse 函 数 ， 返 回 值 都 是 f64 关 型 ， 因 为 这 些 计算 产生 的 值 只 可 能 是 唯 
一 的 结果 。 

代码 第 10 一 21 行 定义 的 log 和 和 sgrt 函 数 ， 人 返回 值 都 为 Option 二 f64 二 类 
型 ， 这 是 因为 求 对 数 和 开 方 有 可 能 产生 NaN。 在 这 两 个 函数 中 分 别 调 用 
标准 库 中 提供 的 log2 和 sqrt 方 法 来 计算 ， 并 通过 is_normal 来 判断 是 含 为 
合法 的 序 点 数 ， 如 果 合 法 则 返回 Some， 人 否则 返回 None。 

在 main 函 数 中 声明 了 译 上 点数 number， 并 通过 Option: : from 方 法 将 
其 转换 为 Some (number) 进行 计算 。 如 代 伍 第 25 行 所 示 ， 可 以 通过 map 
组 合子 方法 将 double、square 和 inverse 函 数组 成 链 式 调用 ， 而 不 需要 从 
Some 二 number 二 中 将 number 取 出 来 进行 计算 。 但 是 当 求 对 数 和 开 方 
上 时， 使 用 map 束 不 方便 了 。 返 回 map 的 定义 ， 如 果 此 处 使 用 map， 那 么 求 
对 数 的 结果 会 被 包装 两 层 Some， 变 成 Some (Some (number) ) 的 形 
式 ， 如 果 再 进行 开 方 操作 ， 则 叉 会 被 包装 为 
Some (Some (Some (number) ) ) 的 形式 ， 这 就 变 得 复 林 了。 所 以 ， 
标准 库 中 提供 了 另外 一 个 组 合子 方法 and_then 来 解决 这 个 问题 。 

代码 第 26 行 所 示 ， 使 用 and_then 来 处 理 log 和 sqrt， 残 可 以 和 map 组 合 
子 正 第 配合 使 用 ， 最 后 输出 正 第 的 结果 。 当 把 第 23 行 number 的 值 改 为 负 
数 ， 则 会 输出 “This failed.” - 

代码 清单 9-11 展 示 了 and_then 组 合子 方法 的 实现 。 

代码 清单 9-11: and_then 组 合子 方法 的 实现 

Le PUB in and, Ehen<U, F> (sli, Ei F) => Optacn<U> 
where F: FnOnce(T) -> Option<U> 
{ 

match self { 

Some (x) => f(x), 


None => None, 


Onno FP W N 


s a 
在 代码 清单 9-11 中 展示 的 and_then 方 法 和 map 方 法 的 区 列 在 于 ， 代 
但 第 5 行 目 配 Some 时 ，and_then 方 法 的 返回 值 并 不 像 map 方 法 那样 包装 了 


一 层 Some。 


bk map 和 and_then 之 外 ， 标 准 库 中 还 提供 了 其 他 组 合子 方法 ， 用 
于 融 效 、 方 便 地 处 理 Option<T > 的 各 种 情况 。 限 于 扁 幅 ， 这 里 不 再 一 
一 介绍 ， 读 者 可 目 行 得 看 标准 库 文 档 。 


9.3.2 错误 处 理 Result 二 T，E> 


Option<T> fake ME 的 问题 ， 它 在 一 定 程度 上 消灭 了 空 指 
针 ， 保 证 了 内 存 安 全 。 但 使 用 Option<T> 实 际 上 并 不 算 错 误 处 理 。 
Rust 专 门 提供 了 Result<T，E> 来 进行 错误 处 理 ， 和 Option< 工 之 相似 ， 
均 为 枚 举 类 型 ， 但 Result<T，E> 更 关注 的 是 编程 中 可 以 合理 解雇 的 错 
误 。 从 语义 上 看 ，Option<T > 可 以 被 看 作 是 忽略 了 错误 类 型 的 Result 去 
T, O >， 所 以 有 时 候 它 们 也 是 可 以 相互 转换 的 。 

代码 清单 9-12 展 示 了 Result<T，E> 的 定义 。 

代码 清单 9-12: Result<T, E> X 


1. #[must_use] 

F pub enum Result<T, E> { 
Ss OK CT) 4 

4 Err (EB) ¢ 

on } 


从 代码 清单 9-12 中 可 以 看 出 ，Result<T，E> 枚 举 体 包含 两 个 变 
体 : Ok (T) 和 Er (E) ， 其 中 OKk (T) 表示 正常 情况 下 的 返回 值 ， 
Err (E) 表示 发 生 错 误 时 返回 的 错误 值 。 其 中 # [must_use] 属性 表示 ， 
如 果 对 程序 中 的 Result<T 工 ， 卫 > 结果 没有 进行 处 理 ， 则 会 上 友 出 警告 来 提 
示 开 发 者 必须 处 理 相 应 的 错误 ， 有 助 于 提升 程序 的 健壮 性 。 

代码 清单 9-13 展 示 了 使 用 parse 方 法 把 字符 串 解析 为 数字 。 

代码 清单 9-13: 使 用 parse 方 法 将 字符 串 解析 为 数字 示例 


fn main() { 
let n = "1"; 
assert egi (n.parsess:<152>0¢ UKLL) J? 
let n = "a"; 
// 输出 Err (ParseIntError { kind: InvalidDigit }) 


PELnELAL "iri t" OR. Parser: <Ls2>l) ) 7 


= OF Oo Be W N FF 


e 4 

FEASTS 9-13, TAY DART EAE APB, AER] DIE fE 
析 的 。 如 代码 第 2 行 和 第 3 行 所 示 。 但 是 对 于 无 法 解析 为 数字 的 字符 串 ， 
则 会 搜 出 错误 。 如 代码 第 4 行 所 示 ， 字 符 串 为 字母 ， 无 法 解析 为 数字 ， 
那么 在 代码 第 6 行使 用 parse Wise Zia, Mes RA, FFREAN 
音 误 类 型 为 Err (ParselntError{kind: InvalidDigit}) ， 其 为 标准 库 内 
置 的 错误 类 型 ， 专 门 用 于 表示 解析 人 处理 失败 的 错误 ， 此 处 是 指 无 效 的 数 
= (InvalidDigit) 。 

高 效 处 理 Result 二 T,， E> 


在 标准 库 std: : result 和 模块 中 ， 也 为 Result<T，E> 实 现 了 很 多 方 
法 ， 比 如 unwrap 系 列 方法 。 对 于 代码 清单 9-13 中 返回 的 解析 错误 ， 融 可 
以 使 用 unwrap_or 方 法 指定 一 个 默认 值 来 解决 ， 但 并 不 优雅 。 其 实 
std: : result 模 块 中 也 提供 了 很 多 组 合子 方法 ， 比 如 map 和 and_then 等 ， 
其 用 法 和 Option 二 TT 二 相似 ， 使 用 组 合子 方法 可 以 更 加 优雅 地 处 理 错 
误 ， 如 代码 清单 9-14 所 示 。 代 码 清单 9-14: 解析 字符 串 为 数字 错误 处 理 
示例 
use Stai inum: :Parselntkrror; 
in. square (number str: tetr) -> Result<132, Parselntirrer> 
{ 


number str.parse:i<i3s2>().map(|n| n.pow(Z) ) 


fn main() { 
match square("10") { 
Ok (nm) => assert eq! (mh, LOO), 


1 
2 
3 
4 
Se | 
6 
7 
8 
9 Err (err) => pranctlyn! ("Brrer? {57} een), 


在 代码 清单 9-14 中 定义 了 square 方 法 ， 传 入 字符 串 ， 然 后 通过 parse 
泛 型 方法 将 其 解析 为 i32 类 型 ， 再 使 用 map 方 法 计算 其 值 。 因 为 parse 方 法 
返回 的 是 Result 类 型 ， 所 以 这 里 可 以 直接 使 用 map Wik. VER square 后 
AN AIR IEE IN ~Result<i32, ParselntError> %7}, 5 ParselIntErrorz Œ 
std: : num 模 块 中 定义 的 ， 所 以 这 里 需要 使 用 use 引 入 。 

在 main 函 数 中 使 用 match 匹 配 square 函 数 的 结果 ， 如 果 是 Ok Cn) ， 
则 返回 正常 的 结 末 : 如 果 是 Err Cer) ， 则 打印 错误 结 

还 可 以 使 用 type 关 键 字 定义 类 型 别名 来 简化 函数 签名 ， 如 代码 清单 
9-15 所 示 。 

代码 清单 9-15: 使 用 type 关 键 字 定义 类 型 别名 来 简化 函数 签名 


1 type ParseResult<T> = Result<T, ParseIntError>; 

2 in square (number str? bste) => ParseResult<i1sz> 
ce { 

4 Hamner Slr. parse? 132>().Map (|| f..powtzZ)) 

5 } 


在 代码 清单 9-15 中 ， 代 码 第 1 行使 用 type 天 键 字 将 Result<T， 
ParselntError > € XA Fill 4 ParseResult<T>, 1X#¢7Esquare K 20 F 1E H 
Wham FTP Ta ea o 
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通过 第 8 ERNITS, EH parse 方法 将 字符 串 解 析 为 十 进 制 数 
字 ， 内 部 实际 上 是 FromStr: : from_str 方 法 的 包装 ， 并 且 其 返回 值 为 
Result<F, <F as FromStr>: : Err> 。 对 于 u32 类 型 实现 的 
FromStr: : from_str 来 说 ， 人 整个 解析 过 程 如 下 : 

FUT AAP BR EBA. MRAZ, WGI 
Err (ParseIntError{kind: Empty}) 。 

EE AT BRERA A, AGE OP Al E TE BR ne TH 
A, JPRS SMM a BHA, Ae PACH. 

人 循环 分 离 从 写 位 之 后 的 字 节 数组 ， 逐 个 用 as 转 换 为 char 类 型 ， 调 用 
to_digit 方 法 将 字 从 转换 为 数字 ， 并 在 循环 中 于 加 。 循 坏 完 毕 后 ， 如 果 全 
部 字符 解 析 成 功 ， 则 返回 正常 的 结果 ; 人 否则， 返回 错误 
Err (ParseIntError{kind: InvalidDigit} ) 。 在 循环 过 程 中 还 需要 计算 是 


APE SOO VAAN AU, ORR T Sik [FRR 
Err (ParseIntError{kind: Overflow}) 。 
看 得 出 来 ， 一 个 看 似 简单 的 parse AYE, Flere oth dat. H 
间 要 抛 出 多 种 错误 类 型 。 但 是 对 于 Result 二 T，E 才 来 说 ， 最 终 只 能 返回 
一 个 Er 类 型 ， 如 果 在 方法 中 返回 了 不 同 的 错 府 类 型 ， 编 译 束 会 报错 。 
那么 在 parse 方 法 内 部 是 如 何 处 理 的 呢 ? 如 代码 清单 9-16 所 示 。 
代 人 清单 9-16: ParseIntError 源 公 
pub struct ParselIntError { 
kind: IntErrorkind, 
} 


enum IntErrorKind { 


1 

2 

3 

4 

SP Empty, 
6 InvalidDigit, 
f; Overflow, 

8 Underflow, 

9 


. j 

代码 清单 9-16 展 示 了 ParseIntError 的 源码 ， 可 以 看 出 ，parse 返 回 的 
其 实 是 一 个 统一 的 类 型 ParseIntError。 其 内 部 成 员 是 一 个 枚 举 类 型 
IntErrorKind， 其 中 根据 解析 过 程 中 可 能 发 生 的 情况 定义 了 四 个 相应 的 
变 体 作为 具体 的 错误 类 型 。 这 束 解 决 了 返回 多 种 错误 类 型 的 问题 。 

在 日 党 开发 中 ， 最 容易 出 错 的 地 方 是 WO 操作 。 所 以 在 Rust 标 准 库 
std: : io 模块 中 定义 了 统一 的 错误 类 型 Error ， 以 便 开 发 者 能 够 方便 
地 人 处理 多 种 类 型 的 VO 错误 ， 如 代码 清单 9-17 所 示 。 

代码 清单 9-17: std: : io 模 块 中 的 Error 源 人 码 


DU SErUCE. FELON + 
repr: Kepr, 
} 
enum Repr { 
OS Cie) 
Simple (ErrorKind), 
Custom (Box<Custom>), 
j 


struct Custom 1 


[Oo Wad &  & tw hh Fe 


— 
Ti, a 


kind: Errorkind, 
TRC: error: Box<error: <ErrortsSendtsync-, 
Ll2 J 
13. pub enum ErrorKind { 
14. NotFound, 
LS. PermissionDenied, 
Loa ConnectionRefused, 
i Be ConnectionReset, 
LS ConnectionAborted, 
19; NotConnected, 
20 
kw 4 


代码 清单 9-17 展 示 了 std: : io: : Error 的 源码 。Error 结 构 体 只 有 一 
个 成 员 repr， 为 Repr 枚 举 类 型 。Repr 枚 举 体 包 含 了 三 个 变 体 : 
Os (i32) 、Simple (ErrorKind) 和 Custom (Box<Custom>) ， 分 别 
表示 控 作 系统 返回 的 错误 码 、 一 些 内 建 的 错误 以 及 开发 者 目 定 义 的 错 
误 。 其 中 ， 在 ErrorKind 枚 举 体 中 根据 日 常 开发 中 比较 常见 的 场景 抽象 出 
了 一 些 相应 的 错误 变 体 。 

下 面 通过 一 个 具体 的 示例 来 看 看 在 实际 开 友 中 如 何 进 行 钳 误 处 理 。 


假如 有 一 个 文件 ， 文 件 的 每 一 行 都 是 一 个 数字 ， 要 求 从 此 文件 中 读 
取 每 一 行 的 数字 并 对 它们 求 和 。 思 路 比较 简单 ， 融 是 二 接 读 取 芒 文件 ， 
并 将 恋 取 到 的 每 一 行 解析 为 相应 的 数字 ， 有 再 友 代 求 和 ， 如 代码 清单 9-18 
FITAR o 


代码 清单 9-18: 从 文件 中 读 取 数 子 并 计算 其 和 


1 use std::env; 

2 use stds:fis:2File; 

3 use stdt:10:2prelude: s*; 

4 ry Wert rs g 

Ja let args: Vec<String> = env::args().collect(); 
6 Delos tC Liz“ BeOS) | 

T let filename = &args[1]; 

8 let mut f = File::open(filename) .unwrap() ; 
9 let mut contents = String: :new(); 

1.0) » reread to string(émut contents) .unwrap (); 
jiga e let mut sum = 0; 

12s LOL @ In Gorprencs, Lines}: 

13. let. W = &.parse: :<1352>().unwrap(); 

14. sum += n; 

Laa } 

a Ora nla. ("i eer. an} s 

Lee J 


代码 清 单 9-18 的 思路 是 ， 从 命令 行 中 接收 参数 作为 文件 名 ， 人 然后 打 
开 文 件 逐 行 读 取 。 首 先 用 到 J 了 std: : env: : args 方 法 ， 通 过 该 方法 可 
以 得 到 命令 行 中 传 入 的 参数 ， 如 代码 第 5 行 所 示 ， 将 参数 收集 为 一 个 Vec 
二 String 二 类 型 的 数组 。 代 码 第 7 行 ， 获 取 命 令 行 参 数 数组 中 索引 为 1 的 
元 素 ， 就 是 文件 名 。 这 里 需要 注意 ，args 中 索引 为 0 的 元 系 古 该 程序 本 续 
的 命名 。 

代码 第 8 行 ， 使 用 File: : open 方 法 打开 指定 的 文件 ， 访 方法 会 返回 
一 个 Result<File，Error 之 ， 这 是 因为 有 可 能 存在 文件 打开 失败 的 情 
况 ， 比 如 文件 名 不 正确 或 者 文件 不 存在 等 。 但 实际 上 在 std: : io 模块 中 
己 经 使 用 type 关 键 字 为 Result<T，Error 之 定义 了 别名 Result<T>， 上 所 以 
该 方法 返回 的 类 型 就 可 以 写 为 Result<File>。 因 此 ， 这 里 需要 调用 
unwarp 方 法 来 解 开 Result 包 闭 ， 得 到 其 中 的 文件 引用 ， 以 进行 后 续 操 
Wer 

代码 第 9 行 和 第 10 行 ， 通 过 read_to_string 方 法 将 文件 中 的 内 容 读 取 
到 一 个 可 变 字 符 串 contents 中 。 使 用 read_to_string 方 法 从 文件 中 旋 取 内 容 
也 是 有 风险 的 ， 比 如 旋 取 的 内 容 不 是 一 个 合法 的 UTF-8 字 和 有 ， 则 旋 取 出 


错 。 该 方法 会 返回 Result<usize 之 类 型 ， 其 中 usize 表 示 读 取 到 的 文件 内 
容 总 字 节 数 。 
代码 第 11 一 15 行 ， 对 谈 取 到 的 字符 串 中 的 内 容 进 行 迭 代 解 析 ， 并 宗 
加 求 和 和。 这 里 解析 也 是 存在 风险 的 ， 万 一 文件 中 混入 了 无 法 解析 为 数字 
的 字符 ， 则 会 报错 。 
将 访 段 代码 命名 为 io_origin.rs， 通 过 rustc 进 行 编译 ， 然 后 执行 : 
$ «fá OF4@Gin ESSE ERE 
[ “20 origin”, “test txt] 
in Eide test. txt 
6 
其 中 ，io_origin 为 编译 后 的 程序 二 进 制 文件 ，test_txt 为 要 读 取 的 文 
件 ， 其 每 一 行 分 别 保存 着 1、2、3， 所 以 代码 执行 结果 为 6。 
假如 在 test_txt 文 件 中 加 入 一 行 汉 字 ， 执 行 代码 时 融会 报 出 如 下 错 


WR: 
thread 'main' panicked at 'called Result::unwrap() on an ‘Err’ value: 
ParseIntError { kind: InvalidDigit }', src/libcore/result.rs:906:4 


看 得 出 来 ， 错 误 消 恩 显 示 了 解析 错误 ParselIntError {kind: 
InvalidDigit}。 可 见 ， 代 码 清单 9-18 的 健壮 性 有 很 大 问题 。 如 果 此 时 想 顺 
利 地 对 能 正 审 解析 出 来 的 数字 进行 求 和 而 不 党 新 加 入 汉字 的 和 干扰， 访 如 
AFEFE IR? 

办 法 之 一 是 像 VO 或 parse 方 法 内 部 实现 那样 ， 目 定义 统一 的 错误 处 
理 类 型 。 办 法 之 二 是 通过 Rust 提 供 的 Error trait。 标 准 库 中 提供 的 所 有 钳 
误 都 实现 了 此 trait， 这 意味 看 只 要 使 用 trait 对 象 融 可 以 统一 错误 类 型 。 
代码 清单 9-19 展 示 了 Error trait 的 定义 。 

Reis 449-19: Error trait 定 X. 


DUS tra Error: Debiig + Display d 
fn description(&self) -> &str; 
fn cause(&self) => Option<&Error> { ... } 

} 

I Bo 
fn from(err: E) -> Box<Error + ‘a> 4 


Box: :new (err) 
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} 

FES 9-19 E X S description cause AAE, DRR ER 
误 的 简短 摘 述 和 导致 错误 发 生 的 原因 。 所 以 实现 该 trait 的 错误 类 型 ， 还 
必须 同时 实现 Debug 和 Display。 然 后 束 可 以 使 用 Box 二 Error 二 或 &Error 
来 表示 统一 的 错误 类 型 了 ，。 

代码 清单 9-19 还 展示 了 为 Box 二 Error+′ a 请 实现 From trait， 这 意味 
看 可 以 通过 From: : from 方 法 将 一 个 实现 了 Error 的 错误 类 型 方便 地 转 
+ A Box<Error> 。 

现在 来 重 构 代 人 码 清 单 9-18， 首 乞 想 到 的 一 个 问题 是 :， 如果 要 返回 解 
析 过 程 中 的 错误 ， 该 怎么 处 理 ? 因为 在 Rust 2015 版 本 中 ，main 函 数 是 没 
有 返回 值 的 (但 是 在 Rust 2018 中 ，main 函 数 可 以 有 返回 值 ) ， 所 以 需要 
把 处 理 文 件 的 代码 独立 到 另外 一 个 函数 中 ， 如 代码 清单 9-20 所 示 。 

代码 清单 9-20: 重 构 代码 清 蛙 9-18， 将 处 理 文 件 代 人 码 独 立 到 run 辐 
数 中 


‘oOo GO ws] Ow & & Wh F 


= 
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16: 
a ae 
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use std::env; 
use stderr error: Error; 
use Stdar:Ts:: File; 
USE Stds tic: sprelude:¢*; 
use std::process; 
type ParseResult<i32> = Result<i32, Box<Error>>; 
rr Hiei foes: i 
let args: Vec<string> = env: :args().collect ();} 
let filename = égargs[1]; 
printins ("lm fale tre filename) 5 
match run(filename) { 
OR) => 4 PELL ("Lie r Be gy 
Err(e) => { 
printi! ("maim errore {Fr ©)? 


process::exit(1); 


} 


在 代码 清单 9-20 中 ， 为 了 处 理 返回 的 错误 ， 将 之 前 main 函 数 中 处 理 
文件 的 代码 独立 到 ron 函数 中 。run 了 水 数 会 返回 Result 二 i32，Box 三 Error 
> 之 关 型 ， 在 main 国 数 中 做 match 匹 配 处 理 ， 如 末 是 Err Ce) ， 则 以 退出 
AY 1A H SEVERE o 

代码 清单 9-21 展 示 了 了 run 函数 的 具体 实现 。 

代码 清单 9-21: runpk ACA AS SEEM 


1 fn run(filename: &str) -> ParseResult<i32> { 

2 Files: open.(filename) map err({l|e| e.into() ) 

3 sand then(|mut Tla 

4 let mut contents = String: :new(); 

Ds read To SLeLng (Smut. contents) 

6 map err(|e| ¢.inte()) map|] |contents) 

f} }) 

8 sand Then (| COntents |4 

9 let mut sum = 0; 

Lay for ¢ in contents. lanes () { 

Lhe maten ¢.parse:'<i15Z2>() { 

LZ a Ok(n) => {sum += n;}, 

LS a Err(err) => { 

14. let err: Box<Error> = err.into(); 
T33 rm ("error into: ity causes {97]" 
16. , err.description(),err.cause()); 
Bs by 

18. // Err (err) => | return Err(From::from(err));}, 
19. } 

20) } 

2 Ok (sum) 

De s }) 

Zos J 


在 代码 清单 9-21 F, run MAHR PA Result<i32, Box< Error 
> > Hall 4 ParseResult<i32>. AZAP AKREEH HASTA 
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代码 第 2 行 ，File; : open 方 法 会 返回 Result<File 之 ， 此 时 用 
map_err (|ele.into ©) ) 来 处 理 打 开 文 件 出 错 的 情况 。 如 果 出 错 ， 则 会 
通过 into 方 法 将 错误 转换 为 Box<Error 盖 类 型 。 前 面 提 到 过 ， 标 准 库 内 
部 的 错误 都 已 经 实现 了 Error trait 和 From trait， 可 以 将 具体 的 错误 类 型 
转换 为 Box<Error 之 类 型 。 注 意 这 个 类 型 转换 ， 实 际 上 是 基于 类 型 目 动 
推导 的 ， 因 为 在 函数 签名 中 返回 值 类 型 是 确定 的 。 如 果 没 有 出 错 ， 则 将 
正 钊 的 文件 引用 往 后 面 传递 。 在 运行 该 代码 时 ， 如 果 给 了 一 个 错误 的 文 


件 参 数 ， 则 会 抛 出 错误 。 这 是 因为 在 File: : open 方法 内 部 的 实现 中 ， 
使 用 return 问 外 抛 出 了 错误 ， 毕 竟 ， 如 末 连 文件 都 没有 正确 谈 取 ， 那 么 
后 续 的 步 又 也 束 没 有 继续 往 下 执行 的 必要 了 。 

代码 第 3~7 行使 用 and then 组 合子 方法 来 处 理由 上 一 步 
map_err 传递 过 来 的 Result<File 之 。 人 代码 第 4 行 和 第 5 行 ， 跟 之 前 一 样 ， 
通过 read_to_string 方 法 将 文件 内 容 讯 取 到 字符 串 中 。 但 是 这 个 过 程 有 风 
险 ， 所 以 这 里 继续 使 用 map_err 来 处 理 出 错 的 情况 ， 并 在 后 面 案 接 了 map 
组 合子 方法 来 回 后 传递 正常 读 取 到 的 字 从 上 串 contents。 

代码 第 8 一 20 行 ， 使 用 and_then 组 合子 方法 处 理 传递 过 来 的 字符 串 。 
此 时 需要 授 历 文件 的 每 一 行 字 从 串 ， 将 其 一 一 解 术 为 合法 的 数字 并 相 
加 。 人 解析 为 数字 的 过 程 是 有 风险 的 ， 有 可 能 出 错 ， 所 以 这 里 使 用 match 
PLACE) Fal Ab FEE AHR ATS. UREE RT. MARTA 
到 sum 中 ;如 果 出 销 ， 则 将 错误 转换 为 Box<<Error 之 类 型 ， 并 且 通 过 调 
用 其 description 和 cause 方 法 分 别 打 印 上 其 体 的 错误 信息 和 出 错 原 因 。 

代码 第 21 行 ， 返 回 Ok (sum) 。 在 main 函 数 中 得 到 处 理 。 

需要 注意 的 是 ， 将 字符 串 解 析 为 数字 默认 处 理 Err Cer) 的 情况 ， 
是 不 会 返回 错误 类 型 的 。 所 以 在 代码 运行 时 ， 束 算 文 件 中 有 不 合法 的 字 
伯 存 在， 该 程序 也 可 以 正常 处 理 合法 的 字符 ， 将 它们 的 值 相 加 并 人 返回， 
WERE ANS AB Tit o 

但 是 如 果 开 发 者 对 文件 的 管理 比较 严格 ， 绝 不 允许 混入 任何 非法 字 
件 ， 那 么 就 需要 在 解析 字符 串 时 通过 使 用 return 关 键 字 同上 传播 错误 ， 
如 代码 第 18 行 所 示 。 如 各 取消 此 行 注 释 ， 将 代码 第 13 一 17 行 注释 反 ， 主 
新 编 谋 、 运 行 之 后 会 发 现 ， 在 旋 取 文件 时 ， 遇 到 非法 字符 融会 解析 到 无 
效 数 字 的 报错 信息 ， 进 程 朋 演 。 但 是 这 种 写法 和 和 直接 使 用 unwrap 7H 
比 ， 其 更 加 优雅 ， 也 可 以 方便 地 管理 错误 。 

使 用 trait 对 象 虽 然 方 便 ， 但 它 属 于 动态 分 友 ， 在 性 能 上 弱 于 目 定义 
统一 的 针 误 类 型 。 现 在 继续 对 代 人 码 进 行 午 构 ， 使 用 目 定义 错误 类 型 ， 如 
代码 清单 9-22 所 示 。 

代码 清单 9-22: 目 定 义 错误 类 型 CliError 


use std::10; 
use std::num; 
use std::fmt; 
# [derive (Debug) ] 
enum ClikError { 
le (10: Error), 
Parse (num: :ParseIntError), 
} 
impl imt::Display fer CLIETEOr | 
Ly fn fmt (&self, f &mut fmt::Formatter) -> fmt::Result { 
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Lig match *self { 

12. Clikrror::Io(ref err) => write! (f, "IO error: {}", err), 
13. CliError::Parse(ref err) => write! (f, "Parse error: {}" 
14. 1 rr), 

13. } 

16. } 

Ted wx 

iĝ, impl. Error for Clakrrer { 

19; fn description(&self) -> &str { 

AP match *self { 

Pl, CliError::Io(ref err) => err.description(), 

Les CliError::Parse(ref err) => Error::description(err), 
23 } 

24. } 

25. fn cause (&self) -> Option<&Error> { 

26: match *self { 

Ela ClikError::Io(ref err) => Some(err), 

28. ClikError::Parse(ref err) => Some (err), 

29, } 

203 } 

Sle j 

32. type ParseResult<i32> = Result<i32, CliError>; 


在 代码 清单 9-22 中 创建 了 日 定义 错误 类 型 CliError， 其 包含 两 个 日 
rH a Te ARR: Io Cio: : Error) 和 Parse (num: : ParseIntError) , 7} 


者 表示 IO 错误 和 解析 错误 ， 并 为 CliError 实 现 了 Display 和 Error。 

注意 代码 第 32 行 ， 在 type 定 义 别 名 ParseResult<i32 之 时 ， 将 之 前 的 
Box 二 Error 二 错误 类 型 转换 为 CliError。 

继续 重 构 代码 。main 函 数 不 需 要 改变 ，run 国 数 同 样 需要 将 之 前 的 
Box<Error> 错 误 类 型 改 为 CliError， 如 代码 清单 9-23 所 示 。 

代码 清单 9-23: 修改 run 函 数 ， 使 用 CliError 


fn run(filename: &str) -> ParseResult<132> { 

2 Piles :open(filename) «map err (Clikrror: Lo) 

3 ,and then(|mut fl 

4 let mut contents = String: :new(); 

ve fread To string (smut contents) 

6 map err (CliErrors slo) map(| |contents) 

7 }) 

8 wend, Then | |CSnTEnCs | 4 

9 let mut sum = 0; 

LE a fer e in contents: Lines () { 

Its match c.parse::<132>() { 

I2.: Ok(n) => {sum += n;}, 

ls Err(err) => { 

14. let err = ClikError::Parse(err) ; 
13. printin! ("Error Info: {i} \n Cause by {:7}" 
LS , err.description(), err.cause()); 
ile by 

LS. 14 Exr(err) => {return Err(CliError::Parse(err) y et; 
19. } 

2G } 

Sl Ok (sum) 

D2 a }) 

Zoe j 


代码 清单 9-23 主 要 的 变化 是 将 Box<Error> 转 换 为 CliError， 使 得 代 
伺 更 加 清晰 、 可 读 。 代 人 码 第 2 行 ，map_err (lele.into (©) ) WBHJ 
map_err (CliError: : Io) ， 除 性 能 上 有 所 改善 之 外 ， 可 读 性 也 有 了 所 
高 ， 可 以 直接 看 出 这 里 处 理 的 是 IO 错误 。 


注 章 此 处 map_err 方 法 接收 的 参数 为 财 包 ， 但 传递 的 却 是 枚 举 体 ， 

不 要 瑟 记 市 数据 的 枚 举 体 实际 上 可 以 作为 函数 指针 来 使 用 。 此 处 
CliError: : Io 相 当 于 fn (io: : Error) ->CliError 函 数 指 针 。 
代码 第 6 行 也 做 了 同样 的 改变 。 

代码 第 14 一 17 行 ， 相 应 地 改 为 CliError: : Parse (err) ， 如 果 是 解 
析出 钳 的 字符 ， 则 打印 具体 的 钳 误 信息 和 出 错 诛 因 ， 但 依旧 不 会 同上 返 
回 销 误 。 如 果 一 定 要 退回 销 误 ， 还 是 需要 使 用 retumn 的 ， 如 代 但 第 18 行 
所 示 。 

取 终 返回 Ok (sum) ， 供 main 哨 数 使 用 。 通 过 这 样 的 重 构 ， 代 人 码 的 
性 能 和 可 读 性 都 有 了 提高 。 那 么 是 否 还 有 进一步 优化 的 空间 ? ERE 
BER). 

Rust 提 供 了 一 个 try! 宏 ， 通 过 它 可 以 允许 开发 者 简化 处 理 Result 错 
误 的 过 程 。 代 码 清单 9-24 展 示 了 try! BAIRI 

代码 清单 9-24: try! 宏 的 源码 


La Macro rules! try { 


2 (Sexpr:expr) => (match Sexpr { 

a Scrate::result::Result::Ok(val) => val, 
4 Scrate::result::Result::Err(err) => { 

2 return SCALES : SPFaSULE?: Result s Err 
6 Scrate::convert::From::from(err) 
7 ) 

oa } 

9， }) 

We 3 


ER 9-247, aM imacro_rules! 来 定义 一 个 宏 ， 以 从 
写 “$” 开 头 的 均 为 宏 定义 中 可 奉 换 的 变量 ， 在 第 12 章 中 会 做 更 详细 的 介 
绍 。 此 处 大 致 可 以 看 出 ， 访 宏 会 目 动 生 成 match 匹配 Result 的 处 理 ， 并 
有 会 将 错误 通过 retum 返回 。 注 意 代 但 第 6 行 ， 通 过 调用 From: : from 
方法 转换 错误 类 型 。 

接 下 来 可 以 继续 重 构 run 困 数 ， 如 代 但 清单 9-25 所 示 。 

代码 清单 9-25: 使 用 try! AE run žr 


inpol FRKOMS1Ot terrer> for Clibrror f 
fn fromi(err: ios:Errer) -> Cliakrror { 


Glitkhrrortsclo (err ) 


} 
imel. PFPromsnume : FarselntError> for Clinrror { 


tn fromierr?: mam: Paree ntError] => C1IERrror i 


g: =] S O E te e = 


ClikFrror::Parse(err) 


9 . } 

ol a 

11. fn run(filename: &str) -> ParseResult<i32> { 
| let mut file = try! (File::open(filename) ); 
13. let mut contents = String: :new(); 

14. try! (file.read to string (êmut contents) ) ; 
Los let mut sum = 0; 

Les for ¢ in contenrcs, li hes () { 

i by i Ler. W 1.32 = Ley! be. pares: t<13a2()) ? 
LB sum += n; 

Ls } 

20% Ok (sum) 

Bike F 


在 代码 清单 9-25 中 ， 代 码 第 1 一 10 行 ， 为 CliError 实 现 了 From 转 换 函 
数 ， 可 以 将 io: : Error 转 换 为 ClieError: : Io (err) ， 将 num: : 
ParseIntError 转换 为 CliError: : Parse (err) ， 这 样 束 可 以 使 用 try! Z 
J 

代码 第 12 行 ， 使 用 try! 宏 来 包装 File: : open， 如 果 打 开 文 件 出 
音 ， 则 会 返回 错误 。 

代码 第 14 行 ， 使 用 try! 宏 包 装 J 了 read to_string 方 法 ， 如 果 读 取 到 非 
UTF-8 的 字 贡 序列 ， 则 会 返回 错误 。 

代码 第 17 行 ， 使 用 try! REA parek, WRAN EEEF 
件 ， 则 会 返回 错误 。 

使 用 try! 安 使 代码 进一步 精简 ， 尤 其 是 代码 第 17 行 。 这 里 值得 注 
意 的 是 ，try! 宏 会 将 错误 返回 ， 传 播 到 外 部 函数 调用 中 ， 在 具体 的 开发 


需求 中 要 确定 是 否 真 的 需要 传播 错误 ， 而 不 要 图 省 事 而 滥用 try! 。 
是 否 还 可 以 继续 精简 代码 ? 答案 是 肯定 的 。 因 为 在 日 常 开发 中 ， 
使 用 uy! 宏 的 问题 是 有 可 能 造成 多 重 内 套 ， 比 如 ay! Cry! 
Cry! ...) ) 这 种 形式 ， 非 常 影响 代码 的 可 读 性 。 为 了 改善 这 种 情况 ， 
Rust 引 入 了 一 个 语法 糖 ， 使 用 问号 操作 符 “? ”来 代替 ty! 宏 。 代 码 清单 
9-26 展 示 了 如 何 使 用 问号 操作 符 重 构 之 前 的 代码。 
代码 清单 9-26:， 使 用 问号 操作 符 蔡 代 try! Z 


1. fn run(filename: &str) -> ParseResult<i32> q 
Lx let mut file = File::open(filename) ?; 
Ss let mut contents = String: :new(); 

4. LS TO String (smut Gontents) 7 
ies let mut sum = 0; 

Gs for © im contents. lines () { 

Ta let Ti 132 = œ:parso: t<152>() 23 

G. sum += n; 

-A } 

LQ a Ok (sum) 

lilẹ J 


EAR 9-26 8 FS el S BEETS SR S try! 宏 ， 代 码 清 晰 了 不 
少 ， 提 高 了 可 读 性 。 问 写 操 作 符 被 放 到 要 处 理 错误 的 代码 后 面 ， 这 种 写 
法 更 加 凸显 了 程序 的 功能 代码 ， 从 可 读 性 上 降低 了 错误 处 理 的 存在 感 ， 
更 加 优雅 。 

4 Option< T> k} NResult<T, E> 

ETA — ZIELA EP rn PA BOR BOE RARE). TA ETE 
main 浮 数 中 ， 还 存在 可 以 改进 的 空间 ， 如 代码 清 时 9-27 所 示 。 

代码 清单 9-27: 在 main 函 数 中 从 命令 行 谈 取 参 数 示 例 


1. let args: Vec<String> = env::args().collect(); 
2. let filename = égargs[1]; 
Su printlni ("In file {}", filename) ; 


在 代码 清单 9-27 中 ， 使 用 env: : args 从 命令 行 读 取 参 数 时 ， 假 如 合 
令 行 没有 传递 参数 ， 那 么 args 中 就 只 存在 一 个 元 素 (二进制 文件 自己 的 


文件 名 ) ， 执 行 到 代码 第 2 行 束 会 抛 出 索引 错误 ， 引 发 main 主 线程 骨 
误 。 这 是 我 们 不 和 硕 望 发 生 的 事情 。 

可 以 使 用 env: : args 的 nth 方 法 来 解雇 此 问题 ，nth 方 法 返回 的 是 
Option< 工 > 类 型 ， 如 代码 清单 9-28 所 示 。 

代码 清单 9-28: 使 用 nth 方 法 重 构 main 函 数 


1 fn main() { 
2 let filename = env::args().nth(l1); 
3 match run(filename) { 
4. Ok(n) => { 
5 peace (Yee, Bie 
6 by 
É Err (e) => { 
8. PLintin! ("Main errors {7", se)? 
9. process::exit(l); 
1G. } 
Lla } 
as |} 


在 代码 清单 9-28 中 ， 使 用 nth 方法 直接 取 参 数 中 索引 为 1 PE, wt 
不 需要 显 式 地 将 env: : args 转 换 为 数组 了 。 如 末 有 参数 ， 则 会 返回 
Some (String) ; 如 采 未 传递 参数 ， 则 返回 None。 此 时 filename 为 Option 
<String 之 类 型 ， 将 filename 传 入 run 函 数 中 。 

相应 地 ，run 函 数 也 需要 做 出 改变 ， 如 代码 清单 9-29 所 示 。 

代码 清单 9-29: 重 构 相关 代码 


i =<] Oy OFF se te Ro e 
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use std: :option: :NoneError; 


[derive (Debug) ] 


enum CliError { 


NoneError(NoneError), 


} 


imel tmtisDisplay ter Clibrror d 
fn fmt (&self, 
match *self { 


f: emut fmt: tFormatter) -> tfmtssResult { 


CliError::NoneError(ref err) => 


write! (f; “Command args errors {:?}", err), 


} 


inol Error for CIAErrer { 


fn description (self; -> &str { 
mateh *selft 1 


CliError::NoneError(ref err) => "NoneError", 


} 


fn cause (&self) 


== Option<éError> { 


match *self { 


} 


impl From<NoneError> for CliError { 


Tr trom (err: 


NoneError) => CliError { 


ClikError: :NoneError (err) 


} 


fn run(filename: 


let mut file 


Option<String>) -> ParseResult<i32> { 
File: :open(filename?) ?; 


在 代码 清和 蛙 9-29 中 只 展示 了 修改 人 代码， 其余 的 代码 则 不 变 。 完 整 代 
A Ay bh eG ba YR Ag 

E3547, rn AÁ MAAKA NOption< String>, Zr 
EREET P, ARBRE FA SBRVETY. VERILY filename YyOption< 
String >XH, (AI SIAR (try! 宏 ) 会 自动 将 Option< String> #4 
换 为 Result<T，NoneError 之 类型， 并 自动 匹配 。 

注意 ， 如 果 想 让 Option< String> 支 持 问号 语法 糖 ， 那 么 必须 得 实 
现 From 人 允许 NoneError 转 换 为 CliError， 如 代码 第 30 一 34 行 所 示 。 

代码 第 3 一 29 行 ， 在 之 前 CliError 的 基础 上 ， 增 加 了 
NoneErr (NoneError) 变 体 ， 所 以 需要 使 用 use 引 入 std: : option: : 
NoneError。 同 时 修改 实现 Display 和 Error 中 match 匹 配 CliError 的 相关 代 
15, AlAmatchY Ana Sara al Reo 1ER, std: : option: : 
NoneError 并 没有 实现 Error trait. 

鉴于 目前 让 Option<T> 关 型 文 持 问号 语法 糖 还 属于 实验 特性 ， 所 
以 需要 在 整个 代码 文件 的 顶部 旅 加 并 ! [feature Ctry_trait) ] 特性 。 然 
后 整个 代码 就 可 以 运行 了 ， 如 末 在 命令 行 中 没有 指定 文件 名 ， 则 会 抛 出 
指定 的 错误 信息 。 

maine 21 |=] Result 

在 Rust 2018 版 本 中 ， 人 允许 main 函 数 返 回 Result<T，E> 来 传播 错 
误 。 继 续 在 代码 清单 9-29 的 基础 上 对 main 函 数 进 行 重 构 ， 如 代码 清单 9- 
30 所 示 。 

代码 清单 9-30: Emain žr, 2&7 Rust 2018 版 本 


in maint) -> Result<(), is2> q 
let filename = env::args().nth(1); 
match run(filename) { 
Ok(n) => { 
peine! ("g2 ji 
return Ok{{7}]z 
by 
Err(e) => { 


0 al Da Owe WwW NO F 


oa return Err (1)3 


LT } 


在 代码 消 半 9-30 中 ， 让 main 函 数 返回 Result<()〉 , i32>2844. Ff 
对 该 示例 ， 返 回 单 元 类 型 *() ”是 因为 当前 有 一 个 限制 ， 必 须 实 现 
std: : process: : Terminatio n 这 个 trait 才 可 以 作为 main 函 数 的 Result 
<T, E>ik Re. Sa RA RRA, BOF. bool, FFA. never 
RASS SLIM Y trait . 

WAS HL9-304m EZ Ja, FEA MIT LA Rare: 

$ ./io option test txt 
6 

S$ ./io option test txtl 
EEPTOES 1 

当 正 确 读 取 文件 时 ， 将 正常 输出 结果 6。 而 当 文 件 指定 错误 时 ， 则 
会 返回 错误 退出 码 1， 与 预期 的 一 致 。 

目前 该 特性 还 在 逐步 完善 中 ， 在 不 久 的 将 来 ， 在 main 函 数 的 Result 
<T，E> 中 应 该 可 以 允许 使 用 更 多 的 类 型 。 

问号 语法 糖 相 关 trait 

和 和 问号 语法 糖 相关 的 trait 是 std: : ops: : Try， 代 码 清单 9-30 展 示 
了 其 定义 。 

代码 清单 9-31: std: : ops: : Try 定义 


1 DUD ERaALE Try 4 

Z type Ok; 

3 type Error; 

4. En Ine Tesultiselr) -> Resuli<eelrtstOk, Selirs terrors 
9 in Erom error(vi Selfi ETEO) => Salf) 

6 in from ok(vy: Ses => Sell; 

7 } 

在 代码 清单 9-31 中 ， 在 Try trait 中 定义 了 两 个 关联 类 型 Ok 和 
Error， 以 及 三 个 方法 into_result、from error 和 from ok。 我 们 看 一 下 为 
Option <T> SEH Try 的 源码 ， 如 代码 清 蛙 9-32 所 示 。 

代码 清单 9-32: AOption<T>iilstd: : ops: : Try 的 源码 


I INDIT ops: Siry for Options 1 

2 type Ok = T; 

3 type Error = NoneError; 

4 fH inte result (self) -> Result<T, Nenekrror> | 
Fa self.ok, OE(NONEETEOGE) 

6 } 

7 Lo Teom orire LDL =F DALT i 

3. Some (v) 

3 } 

Ld in from Serreor( s NoneError) => cell 9 
| Gs None 

LZ } 

Laie. J 


从 代码 清单 9-32 中 可 以 看 出 ， 在 into_result 方法 中 通过 okor 将 
Option<T>4#¢#AResult<T, NoneError>. Mj from_ok 和 from_error 
则 可 以 从 Result<T, NoneError> +4 #l|Option<T> 。 


9.4 AUG (Panic) 


X FRustH iHi, TAG HARE OLD a | Ae ie. ER, EH 
thread: : spawn EEEE RIER pe ehh, Wie FESAT% 
的 原因 ， 在 这 种 情况 下 Result<T，E> 已 经 无 用 。 

Rusthy ee he A iE CRRA SE EMAL) AFC o CHIF 
通过 throw 抛 出 异常 ， 也 可 以 使 用 tryw/catch 来 捕获 异常 ， 但 是 如 果 使 用 不 
当 ， 了 束 会 引起 内 存 不 安全 的 问题 ， 从 而 造成 Bug 或 比较 严重 的 安全 漏 
洞 。 使 用 C++ 写 人 代码， 需要 开发 人 员 来 保证 异 间 安全 (Exception 
Safety) . 

AMY Z PO th es BY Ber FE NA Ve eM? 这 其 实 很 容易 理 
fA. ALDARA, WRT S, ROAM Sai, MABE 
EITA? RAGER IB, Se ACE AZ J RSF it 7k at NS H 
Bl, A AY Rete CTV His A a PAT CEC RSET RMS ETS 
4b) e ZMERNE 

FE UE RI ESK Wi eS RETE FE t PU EE HT AE ie Dt Ya A BE 
构 恶 化。 现代 C++ 使 用 RAII P ARR a el, E pa, A HRE el 
退 (Stack Unwind ) 机 制 来 确 你 在 栈 内 构造 的 局 部 变量 或 指针 的 析 构 
图 数 都 可 以 被 一 一 调用 。 这 样 束 可 以 保证 弄 利 安全 。 而 对 于 Rust 语 言 ， 
其 底层 也 是 基于 RAI 机 制 来 管理 资源 的 ， 在 仆 慨 发 生 之 后 ， 同 样 会 利 
用 栈 回 退 机 制 触 肥 局 部 杰 量 的 析 构 函数 来 保证 异 利 安全 。Rust 和 C++ 的 
不 同 点 在 于 ，Rust 中 的 一 切 都 是 编译 右 可 以 保证 的 ， 而 C++ 要 菲 开 及 者 
日 己 来 保证 ， 如 果 开 发 者 没有 使 用 RAII， 那 么 就 有 可 能 导 色 异常 不 安 
aoe 

Rust t, (HARM (Panic Safety) ŽRE E ENH 
法 。 虽 然 在 Rust 中 可 以 保证 基本 的 臣 慨 安全 ， 但 还 是 有 很 多 代 但 会 引发 
etic, FEUX Nonei#íTunwraptt (E. BRUO, we HER iE ACAE TE Safe 
Rust 中 是 没有 问题 的 ，Rust 提 供 了 一 个 叫 作 UnwindSafe 的 标记 trait， 专 
门 用 来 标记 那些 敬 司 安全 的 类 型 。 但 是 在 Unsafe Rust 中 就 需要 小 心 
了 ， 这 里 是 Rust 编 译 器 鞭 长 莫 及 的 地 方 。 在 第 13 章 中 会 有 关于 Unsafe 
Rust 更 详细 的 介绍 。 


Rust 也 提供 了 catch_unwind FiAKILA KARA, KR AAT 
程 。Rust 团 队 在 引入 catch unwind 方法 时 考虑 了 很 多 关于 内 存 安 全 的 问 
cl, 所 以 该 方法 只 针对 那些 实现 了 UnwindSafe 的 类 型 。 这 样 做 其 实 是 
为 了 避免 开发 者 小 用 catch unwind，Rust 并 不 希望 开发 者 把 catch unwind 
当 作 处 理 错误 的 惯用 方法 。 万 一 将 catch_unwind 方 法 用 于 下 慌 不 安全 的 
代码 ， 则 会 导致 内 存 不 安全 。 除 trait 限 定之 外 ， 还 有 一 些 如 屋 是 
catch_unwind 无 法 捕获 的 。 比 如 在 一 些 租 入 式 平台 中 ， 玖 居 是 使 用 
abort《 进 程 中 止 ， 来 引发 的 ， 并 不 存在 栈 回 退 ， 所 以 也 束 无 法 捕获 了。 

代码 清单 9-33 展 示 了 catch _ unwind 方法 的 使 用 示例 。 

代码 清单 9-33: catch_unwind 使 用 示例 


L. use std pane; 

fo tn Sumlat 132, Do 134) ~> 1321 

dy a+b 

4. } 

Te EA MAL) | 

Os let result. = panicg:cateh unwind(|| | prantind ("hellot"); J); 
Ts aserti (results OF () 1% 

Bi; Let result = panos eaten MWITA] 4 patie! ("on ni") he 
A asserts (result. 1a err) )7 

LY prantlind ("{}", sum(l, 2)) ; 

i 芭 


在 代码 清单 9-33 中 ， 代 码 第 6 行 ，catch_unwind 接 收 的 是 一 个 正 第 的 
闭 包 ， 在 该 财 包 中 并 未 友 生 娩 久 ， 所 以 正和 党 执行 。 
代码 第 8 行 ，catch_unwind 接 收 的 财 包 会 通过 panic! K 5| ARM, 
但 是 catch_unwind 会 捕获 此 念 怀 ， 并 恢复 当前 线程 ， 所 以 代码 第 9 行 和 第 
10 行 才能 顺利 执行 ， 执 行 结果 如 下 : 
thread 'main' panicked at 'oh no!"', src/main.rs:11:8 
note: Run with “RUST BACKTRACE=1° for a backtrace. 
SSS Standard output 


FERR, BRAEM EARP S epia Sh, BAA e Bi 


ERRI uy. GRAVE eta, Wee Hstd: : 
panic: : set_hook 方法 来 目 定 义 消 息 ， 并 把 错误 消 上 县 输出 到 标准 错误 
流 中 ， 如 代码 清单 9-34 所 示 。 

代码 清单 9-34: 使 用 set hook 示例 


| 

2. fn sumla: 134p Dy 134) => i321 

ds atp 

4. } 

Sie TA Malet) 4 

6， let result = panics:catch unwind(|| { println! ("hello!"); }); 
Ty assert: (rasult Ts Ok())% 

8. panic::set hook(Box::new(|panic info| { 

> if let Some (location) = panic 1nTo.location() 4 

10) praintin! ("panic cecurmed. {r at Ch”, 

Lis location, tTile(), Location. line () 

Te ) i 

Le s } Blse 1 

14, printin! ("can't get location information...") 4 

LD } 

16, }) ) 7 

ed let Fesult = parley igaten wnwitd||| 1 panies ("oh fal") y FJ? 
Le. assert. (result. is erm} ); 

19, Bm i maia 2) 4 

Us d 


在 代码 清单 9-34 中 使 用 set_hook 来 自 定 义 错 误 消 轧 ， 如 代码 第 8 一 16 
行 所 示 。 并 且 通 过 获取 panic_info 的 location 信 息 ， 准 确 地 输出 了 发 生 臣 
恒 的 文件 和 行 号 。 输 出 如 下 : 

hello! 
panic occurred. ‘sre/main.xs"* at 18 
3 

需要 注意 的 是 ，set_hook 是 全 局 性 设置 ， 并 不 是 只 针对 单个 代码 模 

块 的 。 通 过 配合 使 用 take_hook 方 法 ， 可 以 满足 开发 中 的 大 部 分 需求 。 


9.5 第 三 方 库 


Rust 标 准 库 中 提供 了 最 原始 的 错误 处 理 抽象 ， 使 用 了 统一 的 Error， 
但 是 在 实际 开发 中 还 是 不 够 方便 。 为 了 提供 更 加 方便 和 工程 性 的 错误 处 
理 方案 ，Rust 和 社区 也 涌现 出 不 少 第 三 方 库 (crate〉， 其 中 比较 知名 的 有 
error-chain 和 failure。 上 有 目前 官方 比较 推荐 的 库 是 failure。 

接 下 来 使 用 failure 库 继续 改写 前 文中 谈 取 文件 并 对 其 中 包含 的 数字 
进行 求 和 的 示例 。 要 使 用 第 三 方 库 ， 必 须 先 使 用 cargo new 命 令 来 创建 一 
个 本 地 库 。 


5 cargo new failure crate 
该 命令 是 由 Rust 目 带 的 包 管 理 需 Cargo 提 供 的 ， 在 第 10 章 中 会 详细 
介绍 Cargo。 访 命令 默认 会 创建 一 个 二 进 制 可 执行 库 〈Bin) 。 
然后 进入 到 failure_crate 根 目录 下 ， 打 开 cargo.toml 文件 输入 依赖 
库 ， 如 代码 清单 9-35 所 示 。 
代码 清单 9-35: cargo.toml 配 置 
1. [dependencies] 
24 taatlure="0.1,.2" 
3. failure derive="0.1.2" 
在 cargo.toml 中 添加 了 两 个 依赖 库 : failure 和 failure derive, XJ 
因为 在 failure_derive 中 定义 了 很 多 宏 ， HERRE EHH o 
再 打开 src/main.rs 艾 件 输 入 引入 的 相关 库 和 模块 ， 如 代码 清 蛙 9-36 
所 示 。 
代码 清单 9-36: src/main.rs 引 入 相关 库 和 模块 


extern crate failure; 

Timacro use] extern crate failure derive; 
use failure::{Context, Fail, Backtrace}; 
use std::env; 


Use SEG?: fS iELle 


OO & GW Y # 


. Use stds: no; tprelude::*, 


在 代码 清单 9-36 中 引入 了 failure 和 failure derive 库 ， 同 时 引入 了 


在 failure 中 定义 的 Context、Fail 和 Backtrace， 还 引入 了 与 读 取 文件 相关 
的 模块 。 接 下 来 需要 定义 一 个 Error 结 构 体 和 ErrorKind 枚 举 体 来 统一 管 
理 错误 ， 如 代码 请 单 9-37 所 示 。 
代码 清单 9-37: 在 srcmain.rs 中 添加 Error 和 ErrorKind 
1. #[derive (Debug) ] 


2e Pub struct Error | 

Ss inner: Context<ErrorKind>, 

4. } 

5. #[derive (Debug, Fail) ] 

6. pub enum ErrorkKind { 

Ts #[Lfail(display = “IcError") | 

8. lo (# [Cause] Stdt 216? Eror); 

9 . #[fail (display = "ParseError") ] 
Lae Parse(#[cause] std::num::ParselIntError), 
hs // 增加 新 的 Error 种 类 

Los d 


failure 库 对 错误 处 理 做 了 进一步 抽象 ， 它 给 开发 者 提供 了 多 种 错误 
处 理 模 式 ， 比 如 : 

: 使 用 字符 串 作 为 错误 类 型 ， 这 种 模式 一 般 适 合 原型 设计 。 

. 目 定 义 失 败 交 型， 可 以 让 开发 者 更 加 目 由 地 控制 错误 。 

: 使 用 Error 类 型 ， 可 以 方便 开发 者 将 多 个 错误 进行 汇总 处 理 。 

:Error 和 ErrorKind 组 合 ， 利 用 目 定 义 错 误 和 ErrorKind 枚 举 体 来 创建 
蝇 大 的 错误 闫 型 ， 这 种 模式 比较 适合 生产 级 应 用 。 

具体 还 得 根据 实际 的 场景 来 采用 合适 的 模式 。 本 例 将 采用 Error 和 和 
ErrorKind 组 合 的 模式 。 代 码 清单 9-37 中 可 以 看 出 ， 在 Error 结 构 体 中 定义 
了 inner 字 段 ， 用 于 汇总 处 理 各 种 错误 类 型 。 而 具体 的 错误 类 型 则 由 
FrrorKind 枚 举 体 来 进行 统一 管理 。 

failure 库 一 共 包 含 两 个 核心 组 件 来 提供 统一 的 错误 常理 抽 象 ， 其 中 
一 个 是 failure: : Fail trait， 和 将 代 标 准 库 中 的 std: : error: : Error 
trait， 用 来 自 定 义 错误 ; 另 一 个 是 failure: : Error 结 构 体 ， 可 以 转换 任 
何 实 现 Fail 的 类 型 ， 在 菜 种 无 顷 目 定义 错误 的 场合 使 用 访 结 构 体 很 方 


便 ， 任 何 实现 了 Fail 的 闫 型 都 可 以 使 用 问号 操作 符 返 回 failure: : 
Error。 

我 们 可 以 目 己 实现 Fail trait， 也 可 以 使 用 failure 库 提供 的 derive 安 目 
动 实现 。 人 代码 清单 9-37 束 是 目 动 实现 Fail 的 。 所 有 的 目 定 义 错误 都 需要 
实现 Display， 所 以 代码 第 7 行 和 第 9 行 通 过 failure 库 提供 的 属性 安 目 动 
为 枚 举 实现 了 Display。 通 过 # [cause] 必 性， 可 以 指定 标准 库 中 内 置 的 基 
fill Fa TRA A 。 

Fail ”trait 受 Send 和 Sync 约 束 ， 表 明 它 可 以 在 线程 中 安全 地 传播 错 
误 。 它 也 有 党 ”static 约 束 ， 表 示 对 于 实现 Fail 的 动态 trait 对 象 ， 也 可 以 被 
转换 为 具体 的 类 型 。 它 还 受 Display 和 Debug 约 束 ， 表 示 可 以 通过 这 两 种 
方式 来 打印 错误 。 在 Fail trait 中 包含 了 cause 和 backtrace 两 个 方法 ， 人 允许 
开发 者 获取 错误 发 生 的 详细 信息 。Fail trait 更 像 一 个 工程 化 版 本 的 Error 
trait， 帮 助 开 发 者 处 理 实 际 开 发 中 的 问题 。 

接 下 来 为 Error 实 现 Fail 和 Display， 如 代码 清单 9-38 所 示 。 

代码 清单 9-38: 在 src/main.rs 中 为 Error 实 现 Fail 和 Display 


ln WNL Paid for Pim { 

2 fn cause(&self) -> Option<é&Fail> { 

3 self.inner.cause () 

4 

Ba fn backtrace (&self) -> Option<&Backtrace> { 
6 self.inner. backtrace () 

1 } 

Da } 

9 impl std: :simt::Display for Error { 

Lo, En imiieselt, Fe imut sha: stmis:formatrer) -> std:tfmb:sResulr 4 
Le stds: fmt Display: i fmt (éself.inner, T) 
Laa } 

Lgu 


在 代码 清单 9-38 中 为 Error 实 现 了 Fail， 其 中 cause 和 backtrace 方 法 只 
需要 调用 inner 的 相应 方法 即 可 。 而 具体 的 inner 类 型 即 是 ErrorKind 中 定 
义 的 各 种 类 型 的 错误 ， 退 过 failure 提 供 的 属性 宏 已 经 日 动 实现 了 cause。 
而 backtrace 则 使 用 默认 的 实现 。 


接 下 来 则 需要 为 Error 实 现 From 转 换 ， 如 代码 清单 9-39 所 示 。 
代码 清单 9-39: 在 srcwmain.rs 中 为 Error 实 现 From 转 的 


il inol PLOMMSEaGs i: 1Oishrrer> for Bror { 

2 in Eromterr: Sta: tao: tError) => Error 4 

3 Errer 4 

4 inner: Context: :new ( 

oa ErrorKind::Io(err, Backtrace::default() ) 
6 ) 

7 } 

8 } 

9 } 

LO. impi From<stas inum? sbPareelnthrrorY Lon Error { 

Lis 下 CrOM(Srre Woden : Parselrrerror) => Error i 
ikp Error { inner: Context::new(ErrorKind::Parse(err)) } 
3 } 

14. } 


15. type ParseResult<132> = Result<i32, Error>; 

在 代码 清单 9-39 中 ， 通 过 From 为 Error 实 现 转 换 到 std: : io: : Error 
和 std: : num: : ParseIntError 的 能 力 。 

最 后 通过 type 关键 字 定 义 统一 的 ParseResult<i32 之 关 型 进行 错误 
处 理 ， 其 中 默认 的 错误 类 型 是 Error。 这 样 就 实现 了 统一 的 错误 管理 ， 而 
日 还 附和 之 了 Fail trait 的 诺 多 默认 好 处 ， 比 如 前 文中 所 朱 述 的 并 有 安全 
等 。 本 例 的 完整 代码 可 以 参考 随 书 源码 中 的 failure_crate 包 。 

failure 库 的 具体 用 法 未 来 可 能 有 所 变更 ， 但 是 基本 的 钳 误 统一 管理 
思想 不 会 有 太 大 改变 。 而 且 官 方 还 在 考虑 将 failure 引 入 标准 库 中 ， 但 是 
未 来 到 确 如 何 ， 目 前 还 未 有 定论 ， 让 我 们 拭 目 以 每 吧 。 


9.6 小 结 


通过 本 章 的 学 习 ， 我 们 了 人 解 到 Rust 通 过 区 分 错误 和 异常 来 保证 程序 
的 健壮 性 。 

Rust 强 大 的 类 型 系统 ， 在 一 定 程 上 度 上 保证 了 函数 调用 不 会 因为 违 
RRA MEMAR, HEDER NA RKT D. Am, Rust pé 
供 了 断言 机 制 ， 用 于 保证 图 数 运行 中 的 检查 ， 如 果 出 现 违反 “契约 ”的 情 
况 ， 则 会 引用 线程 臣 居 。 这 是 基于 “快速 失败 (Fast Fail) ”的 思想 ， 可 
以 让 Bug 提 前 其 露出 来 。 但 是 不 能 得 用 断言 安 ， 因 为 assert! 宏 有 一 定 的 
性 能 开销 ， 因 此 需要 根据 具体 的 情况 来 选择 ， 尽 量 使 用 debug_assert! 
KAR Bassert! Æ- 

Rust 并 不 提供 传统 语言 的 异常 处 理 机 制 ， 而 是 从 函数 式 语言 中 借鉴 
了 基于 返回 值 的 错误 处 理 机 制 。 通 过 Option<T 之 和 Result<T 工 ， 王 > 将 钳 
误 处 理 进 一 步 区 分 为 不 同 的 层次 。Option<T> 专 门 用 来 解决 * 有 或 
无 ”的 问题 ， 而 ” Result 二 T，E 之 专门 用 来 处 理 错 误 和 传播 错误 。 这 里 要 
区 分 错误 和 和 异常， 所 谓 错 误 是 和 业务 相关 的 ， 是 可 以 被 合理 解决 的 问 
题 ， 而 异常 则 和 业务 无 天， 是 无 法 钻 合 理解 决 的 问题 。 在 Rust 中 ， 基 于 
Result< 工 ， 匡 > 的 错误 处 理 机 制 是 主流 。 虽 然 Rust 也 提供 了 
catch_unwind yA HARA ee, (Ee ARIA, SPAN BETH RNA 
baie 

Rustidte fe S fal -S EVA EK fal (628 FResult<T, E> ME RAEN 
制 ， 这 不 仅 方便 了 开发 者 ， 而 且 还 提高 了 代码 的 可 谈 性 。 

为 了 增强 错误 处 理 的 工程 性 ，Rust 社 区 还 涌现 出 很 多 优秀 的 第 三 方 
库 ， 其 中 有 代表 性 的 是 error chain#llfailure. error chain 的 特色 是 使 用 自 
定义 的 宏 来 方便 开发 者 统一 管理 错误 ， 而 failure 的 错误 管理 思维 则 是 对 
标准 库 中 Error 的 进一步 增强 ， 更 加 贴近 Rust 的 错误 处 理 思 和 想 ， 所 以 目前 
官方 比较 推荐 failure。 

总 的 来 说 ，Rust 的 错误 处 理 机 制 是 基于 对 当前 各 门 编程 语言 的 异 利 
处 理 机 制 的 深刻 反思 ， 结 合 目 身 内 存 安 全 系统 级 的 设计 目标 而 实现 的 。 
开发 者 只 有 按 Rust 的 设计 哲学 进行 正确 的 错误 处 理 ， 才 有 利于 写 出 更 加 
健壮 的 程序 。 


第 10 章 模块 化 编程 


民 好 的 秩序 是 一 切 美 好 事物 的 基础 。 

时 至 今日 ， 软 件 开 肥 早已 从 单打 独 斗 到 入 了 相互 协作 的 时 代 。 在 日 
第 开 肥 中 ， 几 乎 每 一 个 系统 都 在 依 顿 刚 人 编写 的 区 库 或 械 架 。 目 开源 运 
动 兴起 ， 到 现在 GitHub Mies he, KERF ROR BCR BONE A 
如 条 想 要 解决 什么 问题 ， 只 需要 到 GitHub 之 类 的 开源 平台 直接 寻找 现 
成 的 解雇 方案 即 可 。 而 这 些 现 成 的 解决 方案 大 多 和 契 由 不 同 国家 的 不 同 开 
及 者 提 供 的 ， 而 且 针 对 同一 个 问题 也 有 多 种 不 同 的 解决 方案 。 这 些 不 同 
的 解决 方 条 之 所 以 能 够 被 有 效 、 方 便 地 复 用 ， 完 全 是 因为 模块 化 编程 。 

模块 化 编程 ， 是 指 可 以 把 整个 代码 分 成 小 块 的 、 分 敌 的 、 独 立 的 代 
码 块 ， 这 些 独立 的 代码 块 束 被 称 为 模块 ”。 把 一 个 复 末 的 软件 系统 按 一 
定 的 信息 分 割 为 外 此 独立 的 模块 ， 有 利于 控制 和 克服 系统 的 复 森 性 。 棕 
块 化 开 友 际 文 持 多 人 协作 之 外 ， 还 支持 各 部 分 独立 开 友 、 测 试 和 系统 集 
成 ， 攻 至 可 以 限制 程序 钳 误 的 影响 范围 。 总 的 来 次 ， 模 英 化 编程 拥有 如 
下 三 扩 好 处 : 

增强 维护 性 。 一 个 谈 计 民 好 的 模 吴 ， 狸 立 性 更 高 ， 对 外 界 的 依赖 
更 少 ， 蝎 方便 维护 。 

隔离 性 。 拥 有 各 目的 命名 空间 ， 避 免 命名 训 突 ， 限 制 错误 范围 


入 


:代码 复 用 。 通 过 引入 现成 的 模块 来 避免 代码 复制 。 
基于 模块 化 的 诸多 好 人 处， 很 多 编程 语言 痢 文 持 模 块 化 ， 只 十 模 块 化 
的 方式 和 程度 均 有 不 同 。 比 如 C 或 C++， 使 用 头 文 件 的 方式 来 进行 模块 
化 编程 。 而 Ruby 在 语法 层面 百 接 文 持 侦 块 《Module) ，Python 的 一 个 文 
件 融 是 一 个 模块 。 本 来 在 语言 层面 不 文 持 模块 化 的 JavaScript 语 言 ， 因 为 
大 前 端 时 代 的 来 临 ， 也 不 得 不 在 ES 6 中 加 入 模块 化 支持 。Java 语 言 之 前 
也 不 支持 模块 化 ， 社 区 长 期 使 用 JAR 文 件 来 进行 模块 化 开发 ， 但 是 Java 
9 也 在 语法 层面 文 持 了 模块 化 系统 。 由 此 可 见 模块 化 的 重要 性 。 

但 是 只 有 桂 块 还 不 足以 高 效 编写 结构 化 的 软件 系统 。 那 么 如 何方 便 
地 集成 第 三 方 开 友 的 功能 柑 块 ? 一 个 简单 的 解决 办 法 融 是 投 照 约定 的 目 


KARERE, HE H aa aE TT RR, BA 
方便 外 部 集成 。 这 种 按 约定 的 目录 结构 打包 的 模块 ， 残 被 称 为 包 。 在 
编写 一 个 包 的 时 候 ， 也 难免 会 依赖 第 三 方 包 ， 而 这 些 被 依 赖 的 包 也 随时 
可 能 被 更 新 、 修 改 、 升 级 ， 所 以 一 般 使 用 厂 本 化 管理 。 包 与 包 之 间 的 厂 
本 依赖 关系 ， 手 工 处 理 起 来 比较 厅 烦 ， 所 以 需要 使 用 包 管 理工 共 来 解雇 
依赖 、 打 包 、 编 译 、 安 闭 等 功能 。 币 见 的 包 和 党 理工 具有 Linux E H H 
rpm、yum 和 apt 等 ， 语 言 级 别 的 有 Ruby 的 RubyGems、Python 的 pip， 以 
及 JavaScript 的 npm。 

Rust 作 为 现代 化 编程 语言 ， 强 有 力 地 文 持 模块 化 编程 。Rust 中 有 的 包 
常理 工具 叫 作 Cargo ， 第 三 方 包 叫 作 crate 。Rnust 拥 抱 开源 ， 所 有 的 第 三 
方 包 都 可 以 在 GitHub 上 面 找到 ， 并 且 可 以 通过 Cargo 和 直接 发 布 到 包 仓 库 


平台 crates.io 上 耐 。 


10.1 包 管 理 


与 其 他 大 多 数 语言 不 同 的 是 ， 使 用 Rust 编 写 代 码 的 最 基本 单位 是 包 

(crate) 。Rust 语 言 内 置 了 包 管 理 器 Cargo， 通 过 使 用 Cargo 可 以 方便 地 
创建 包 。Cargo 一 共 人 做 了 四 件 事情 : 

使 用 两 个 元 数据 (metadata) 文件 来 记录 各 种 项 目 信 息 。 

医 取 并 构建 项 目的 依赖 关系。 

使 用 正确 的 参数 调用 rustc 或 其 他 构建 工具 来 构建 项 目 。 

` 为 Rust 生 态 系 统 开 有 建立 了 统一 标准 的 工作 流 。 

:通过 Cargo 提 供 的 命令 可 以 很 方便 地 管理 包 。 


10.1.1 使 用 Cargo 创 建 包 


使 用 cargo new 命 令 创 建 包 csv-read: 


$ cargo new csv-read --lib 


Created library csv-read project 
TEA imit H treetit 2 BA HRK: 
S tree csv-read 


csv-read 


-一 Cargo. tom 
L— src 


L— lib.rs 

该 包 中 包含 的 文件 有 Cargo.toml 和 Srclib.rs。 其 中 Cargo.tom] 是 包 的 
配置 文件 ， 是 使 用 TOML 语言 H 编写 的 。TOML 语 言 的 特色 是 : 规范 
简单 、 语 义 明 旺 、 阅 读 性 局 。TOMEL 专 门 被 设计 为 可 以 无 监 义 地 映射 为 
险 希 表 ， 从 而 可 以 更 容易 地 解析 为 各 种 语言 中 的 数据 结构 。 而 
Cargo.toml 正 是 元 数据 文件 乙 一 。 打 开 Cargo.toml， 可 以 看 到 如 代码 清单 
10-1 TAN HIRIS. 

代码 清单 10-1: Cargo.toml xc {tA 


1. [package] 

2. name = "“csv-read" 

3. version = "0.1.0" 

4. authors = ["Your Name <you@email.com>"] 
5. €601t10n = "2016" 

6. [dependencies] 


代码 清单 10-1 展 示 了 Cargo.toml 文 件 的 内 容 (manifest tF) ， 它 里 
面 记 录 了 用 于 编译 整个 包 所 用 到 的 元 数据 。 代 码 第 1 一 5 行 定 义 的 是 包 信 
已 ， 记 录 了 所 的 名 字 为 “csv-read”。 

从 Rust 1.30 版 本 开始 ， 默 认 创建 的 crate 都 会 市 有 edition WW, HER 
认 设 置 为 “2018 ”。 这 代表 默认 crate 使 用 Rust 2018 版 本 。 如 果 有 需要 ， 
也 可 以 将 其 修改 为 “2015”， 以 便 支 持 Rust 2015 版 本 。 

再 打开 srclib.rs 文 件 ， 其 初始 内 容 如 代码 清单 10-2 所 示 。 

代码 清单 10-2: srclib.rs 初 始 内 容 

Ly & lere (test) ] 


2 mod tests { 

3 #[test] 

as fn it works() { 

= assert eq!(2 + 2, 4); 
6 } 

7 } 


在 src/lib.rs 中 ， 初 始 内 容 只 有 tests 模 块 。 在 Rust 中 使 用 关键 字 mod 来 
定义 模块 。#[cfg (test〉] 属 性 为 条 件 编 译 ， 告 诉 编 详 右 只 在 运行 测试 
(cargo test 命令 ) 时 才 编 译 执行 。 在 tests 模 块 中 ， 生 成 了 一 个 示例 方法 
it works。 只 要 进入 该 包 的 根 目 孙 下 ， 然 后 执行 cargo test 命令 ， 即 可 看 
BY MIE ISAT, ON RATAN. 


Compiling csv-read v0.1.0 (file:///LocalPath/to/csv-read) 
Finished dev [unoptimized + debuginfo] target(s) in 0.78 secs 
Running target/debug/deps/csv_ read-1716337329e24fcé6 

running 1 test 

LOS TEStSSt1t WEEKS car GE 

test result: 

ok. 1 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out 

Doc-tests csv-read 

running 0 tests 

test result: 


ok. 0 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out 


可 以 看 出 ，tests: : 让 L_works 测 试 方法 和 被 成 功 执行 ， 显 示 “ok.1 
passed”。 但 是 我 们 看 到 下 面 义 有 Doc-tests， 这 其 实 是 指 文档 测试 ， 因 为 
Rust 支 持 在 文档 注释 里 写 测试 。 而 这 里 并 没有 写 任 何 文档 测试 。 

此 时 再 使 用 tree 命 令 来 但 看 目录 结构 ， 如 下 所 示 。 


-一 EDGCeOGCK 
-一 Cargo.toml 


-一 DLC 


| tl lib.rs 
L target 
EL 一 E * 
可 以 看 出 ， 多 了 一 个 Cargo.lock 文件 和 target 文 件 夹 。Cargo.lock 是 
另外 一 个 元 数据 文件 ， 它 和 Cargo.toml 的 不 同 点 如 下 : 
- Cargo.toml 是 由 开 友 者 编写 的 ， 从 广义 上 来 摘 述 项 目 所 需要 的 各 
种 信息 ， 包 括 第 三 方 包 的 依赖 。 
- Cargo.lock 只 记录 依赖 包 的 评 细 信息 ， 不 需要 开发 者 维护 ， 而 是 由 
Cargo 目 动 维护 的 。 
target 文 件 夹 是 专门 用 于 存储 编译 后 的 目标 文件 的 。 编 译 默 认 
为 Debug 模式 ， 在 该 模 式 下 编译 絮 不 会 对 代码 进行 任何 优化 ， 所 以 编译 
时 间 较 短 ， 代 码 运 行 速度 较 慢 。 也 可 以 使 用 --release 参数 来 使 用 发 布 模 
式 ， 在 该 模式 下 ， 编 详 希 会 对 代码 进行 优化 ， 使 得 编译 时 间 变 悍 ， 但 十 


代码 运行 速度 会 变 快 。 

使 用 cargo new 命令 默认 创建 的 是 库 文 件 〈 生 成 静态 或 动态 链接 
fe) ， 它 并 非 可 执行 文件 ， 而 是 专门 用 于 被 其 他 应 用 程序 共享 的 功能 横 
块 。 如 果 想 创建 可 执行 文件 ， 那 么 需要 使 用 --bin 参数 。 


S cargo new --bin csv-read 


Created binary (application) csv-read project 


加 --bin 参数 或 者 什么 部 不 加 ， 所 创建 的 包 束 可 锐 编 详 为 可 执行 文 
件 。 使 用 tree 命 令 来 全 看 其 目录 结构 ， 如 下 所 示 。 
$ tree csv-read 


csv-read 


— Cargo.toml 
L— src 


上 main.rs 
这 里 唯一 的 变化 是 在 src 下 面 的 是 main.rs 文 件 。 人 代码 清单 10-3 展 示 了 
main.rs 文 件 的 初始 内 容 。 
代码 清单 10-3:， src/main.rs 初 始 内 容 


1. fn main() { 
Bis printin: ("Hello, world!) ; 
Se J 


在 main.rs 文 件 中 默认 定义 了 main 国 数 ， 这 理所当然 ， 因 为 可 执行 文 
件 必 须要 有 程序 入 口 。 可 以 通过 执行 cargo _ build 命令 来 编译 该 包 ， 但 要 
注 量 ， 必 须 在 包 的 根 目 录 下 执行 该 命令 。 也 可 以 直接 使 用 cargo_ run 命令 
来 编译 并 运行 该 包 ， 如 下 所 示 。 

S cargo run 
Compiling csv-read v0.1.0 (file:///LocalPath/to/csv-replace) 
Finished dev [unoptimized + debuginfo] target(s) in 1.35 secs 
Running “target/debug/csv-read- 
Hello, world! 


10.1.2 使 用 第 三 方 包 
在 日 第 开 友 中 ， 经 第 会 使 用 到 第 三 方 包 。 在 Rust 中 使 用 第 三 方 包 


JE% fa AL, JA m 22 7ECargo.toml'? HW [dependencies] F MZ JI KRY 
BU AY . 
假如 想 在 上 面 创 建 好 的 csv-read 中 添加 linked-list 包 ， 如 代码 清单 10- 
4 所 未 。 
代码 清单 10-4: 在 Cargo.toml 文 件 中 添加 linked-list 依 赖 
1. [dependencies] 
os linked-list = "0.0.3" 
然后 在 Srcmain.rs 或 src/lib.rs 文 件 中 ， 使 用 extern crate 命 令 声明 引入 
该 包 即 可 使 用 ， 如 代码 清单 10-5 所 示 。 
代码 清单 10-5:， 在 src/main.rs 文 件 中 使 用 extern crate 命 令 声 明 引 入 
第 三 方 包 
extern crate linked. list; 


1 

2. fn main() { 
3 printini (“Hello, worlda!™) ; 
4 


è | 

在 代码 清单 10-5 中 ， 人 代码 第 1 行使 用 extern crate 声明 引入 第 三 方 
包 。 这 是 Rust 2015 版 本 的 写法 。 在 Rust 2018 版 本 中 ， 可 以 省 略 掉 
extern crate 这 种 写法 ， 因 为 在 Cargo.toml 中 已 经 添加 了 依赖 。 

男 外 ， 值 得 注意 的 是 ， 使 用 extern crate 声明 包 的 名 称 是 
linked_list, HHJ Rize“ ”， 而 在 Cargo.toml 中 用 的 是 连 字 符 “-”。 这 
是 怎么 回 事 呢 ? 其 实 Cargo 默 认 会 把 过 字符 转 换 成 下 困 线 。 这 是 为 了 统 
一 包 名 称 ， 因 为 linked-list 和 linked_list 到 底 是 不 是 同一 个 包 ， 容 易 造 成 
BEX 

Rust 也 不 建议 以 “-rs” 或 “rs” 为 后 级 来 命名 包 名 ， 并 且 会 强制 性 地 将 
此 后 级 去 挥 ， 所 以 在 命名 时 要 注意 。 接 下 来 ， 退 过 介绍 在 日 剃 编程 中 两 
个 比较 实用 的 第 三 方 包 ， 来 看 看 如 何 集成 第 三 方 包 完 成 功能 。 

使 用 正则 表达 式 regex 包 

在 Rust 标 准 库 中 并 没有 内 置 正 则 表达 陈 的 文 持 ， 它 是 作为 第 三 方 包 
而 存在 的 ， 名 为 regex。 现 在 使 用 cargo new--bin use_regex 命 令 创建 一 个 
新 的 包 ， 然 后 在 Cargo.toml 文 件 中 这 加 regex 人 依赖 ， 如 代码 清单 10-6 所 
ZN o 


代码 清单 10-6: 在 Cargo.toml 文 件 中 添加 regex 依 赖 


1. [dependencies] 


2. regex = "1.0.5" 
当前 regex 最 新 的 版 本 是 1.0.5。 然 后 ， 在 src/main.rs 中 同样 使 用 extern 
crate 来 声明 引入 regex 包 ， 如 代码 清单 10-7 所 示 。 
代码 清单 10-7: 在 src/main.rs 中 声明 引入 regex 包 


1. extern crate regex; 

2. use regex: :Regex; 

3e Const TO SEARCH: &"static str = " 

da On 2UL7T-l2-Sly Kappy. On 2018-01-01; New Year. 
de MI 

6s Im mainid) i 

Ta let re = Regex::new(r"(\d{4})-(\d{2})-(\d{2})").unwrap(); 
G for caps in ré.Gaptures iter(TO SEARCH) { 
9. Printins (“vear: {|}, Menta (fe day: IT 
ka caps get (1) -unwrap () -as str(); 

Lis caps .get (2) unwrap () «as str(); 

Lz Gaps et (3) unwrap) .Ws str) )} 

La, } 

14. } 


使 用 cargo run 命 令 编 详 并 执行 该 包 ， 会 得 到 如 下 执行 结 
year: ZOl7, month: iz, day: 31 
year: 2018, month: Ol, day: Ol 


在 代码 清单 10-7 中 ， 先 使 用 extern crate regex 声明 引入 regex 41, 
然后 使 用 use regex: : Regex 声 明 ， 是 为 了 简化 人 代码， 这样 就 可 以 直接 
在 use_regex 包 里 使 用 Reg ex 了 ， 如 代码 第 7 行 所 示 。 

如 条 不 使 用 use 声明 ， 那 么 也 可 以 直接 使 用 regex: : Regex: 
new， 但 是 在 可 该 性 上 残 关 了 许多 。 

代码 第 7 行 ， 给 定 了 正则 表达 陈 字 符 串 ， 由 此 生成 正则 实例 re。 然 
后 在 代码 第 8 行 ， 通 过 captures_iter 方法 ， 对 给 定 的 常量 字符 串 
TO_SEARCH 进 行 匹 配 和 办 代 ， 并 依次 将 捕获 匹配 到 的 字符 串 打 印 出 


来 ， 因 为 给 定 的 正则 表达 式 是 市 有 捕获 组 的 表达 式 。 

regex 包 文 持 大 部 分 正则 匹配 功能 ， 但 不 文 持 环视 〈look-around ) 
和 和 反问 引用 (backreference) 。 这 是 因为 regex 注重 性 能 和 安全 ， 而 环 
视 和 有 反问 引用 更 容易 被 黑客 利用 制造 ReDos 攻击 。 如 果 一 定 要 使 用 环视 
和 反问 引用 ， 则 可 以 使 用 fancy-regex €. 

regex 包 也 文 持 命名 捕获 ， 如 代码 清单 10-8 所 示 。 

代码 清单 10-8: 使 用 命名 捕获 的 示例 


Ls LA MALM 4 

2 let re = Regex: :new(r" (?x) 

3 (2?P<year>\d{4}) # the year 

4. = 

A. (?P<month>\d{2}) # the month 

6 = 

7 (?P<day>\d{2}) # the day 

8 ") , Giwran ()j 

9 let caps = re.captures ("2018-01-01") .unwrap () ; 
LU, assert eg: ("2018"; kceaps ("year |); 

Ls assert eq! ("01", &caps month” |) 7 

LZ assert, AGL UL ss seas "aay" |) 7 

La. let after = re.replace al1("2018-01-01", "$month/Şday/Şyear"); 
14. assert eq! (after, "01/01/2018") ; 

Lös J 


在 代码 清单 10-8 中 ， 人 代码 第 2 一 8 行 ， 传 给 Regex: : new 方 法 的 正则 
表达 式 以 〈? x) 为 前 级 ， 这 是 指定 了 正则 表达 式 标 记 X。regex 包 文 持 
多 种 正则 表达 式 标记 ， 症 义 如 下 : 

“i ， 风 配 时 不 区 分 大 小 写 。 

m, 多 行 模 式 ， “2 和 “$2" 对 应 行 首 和 行 尾 。 

s, 多 许 通配符 “.” 匹 配 “n”。 

U; ASU; XRAM? PEM. 

uw, 小 写 u， 人 允许 支持 Unicode (默认 启用 )。 

X, AETR HRA) 


所 以 ， 在 代码 清单 10-8 中 ， 从 代码 第 2 一 8 行 可 以 看 到 ， 为 正则 表达 
式 加 上 了 空格 和 注释 也 不 影 啊 最 终 的 匹配 结果 。 也 要 注意 在 该 正则 表达 
式 中 使 用 了 (? P<name>exp) 这 种 格式 来 定义 命名 捕获 组 。 

ASOT, EH captures 77 VE wt A) VARA VO ACHR AE, TP RE 
#I|—“*HashMap#, Llane ee 7/E NHashMaphté, VLCI FIE IEN 
值 。 代 但 第 10 一 12 行 ， 束 可 以 直接 从 caps 中 按 指 定 的 键 取 相应 的 值 。 

代码 第 13 行 和 第 14 行 ， 使 用 replace_all 方 法 按 指定 的 格式 来 蔡 换 匹 
配 的 字符 串 。 注 曹 指 定 的 格式 是 以 “$” 从 写 和 命名 捕获 变量 组 合 而 成 
的 。 

regex 还 有 很 多 其 他 功能 和 用 法 ， 可 以 翻阅 其 文档 来 获取 更 多 内 
a 

惰性 静态 初始 化 lazy_static 包 

在 编程 中 ， 经 常会 有 对 全 局 常量 或 变量 的 需求 。Rust 文 持 两 种 全 局 
类 型 : 普通 常量 (Constant) 和 静态 变量 (Static) 。 它 们 的 异同 之 处 
ÆFA PILE: 

”都 是 在 编 详 期 求 信 的， 所 以 不 能 用 于 存储 需要 动态 分 配 内 存 的 次 
型 ， 比 如 HashMap、Vector 等 。 

` 普通 第 量 古 可 以 被 内 联 的 ， 它 没有 确定 的 内 存 地 址 ， 不 可 变 。 

前 态 变 量 不 能 被 内 联 ， 它 有 精确 的 内 存 地 址 ， 拥 有 静态 生命 周 


. 静态 变量 可 以 通过 内 部 包含 UnsafeCell 等 的 容器 实现 内 部 可 变性 。 

: 静态 变量 还 有 其 他 限制 ， 比 如 不 包含 任何 析 构 函数 、 包 含 的 值 类 
型 必须 实现 了 Sync 以 保证 线程 安全 、 不 能 引用 其 他 静态 变量 。 

» 普通 常量 也 不 能 引用 六 态 变 量 。 

在 存储 的 数据 比较 大 、 需 要 引用 地 址 或 具有 可 变性 的 情况 下 使 用 
HESTE; ON, MARCHA es 。 但 也 有 一 些 情况 是 这 两 种 
全 局 类 型 无 法 满足 的 ， 比 如 想 使 用 全 局 的 HashMap 或 Vector， 或 者 在 使 
用 正则 表达 式 时 只 让 其 编译 一 次 来 提升 性 能 。 在 这 种 情况 下 ， 推 荐 使 用 
lazy_static 包 。 

利用 lazy_static 包 可 以 把 定义 全 局 表态 变量 延 运 到 运行 时 ， 而 非 编 


ER, MALATE Clazy) ”. 7ECargo.toml + W Jillazy_static{tK i 
如 代码 清单 10-9 所 示 。 


代码 清单 10-9: 7ECargo.toml Ys Jillazy_statictk Hi 


1. [dependencies] 
2. regex = "1.0.5" 
3. lazy statac = "1.1.0" 


继续 在 use_regex 包 中 添加 lazy_static 依 赖 。 然 后 在 srcmain.rs 中 通过 
extern crate 引 入 lazy_static 包 ， 如 代码 清单 10-10 所 示 。 


代 公 清单 10-10: 修改 src/main.rs 文 件 ， 通 过 extern crate5| 入 
lazy_static 包 


le #[mäcro use] Gxtern crate lazy statié; 

2. extern crate regex; 

3. use regex::Regex; 

4, lazy static! { 

Bi static ref RE: Regex = Regex: :new(r" (?x) 

6. (?P<year>\d{4})- # the year 

Ts (?P<month>\d{2})- # the month 

8. (?P<day>\d{2})  # the day 

9. ") ,unwrap (); 

10. static ref EMAIL RE: Regex = Regex: :new(r" (?x) 
Ll; “\wt@(?:gmail|163|qq)\.(?:com|cn|com\.cn|net)$ 
12% ") ,unwrap(); 

Ue 1 

id, fin regex date(text: &str) -> regex: captures i 
13s RE.captures (text) .unwrap () 

16s. |} 

Li. Ta egez Small (test: str) -> Bool 4 

Le. EMAIL RE.is match (text) 

13» } 

20. fn main() { 

i Let. Gaps = regex date ("2018-01-01") ; 

Za. assert eq! ("2018", écaps["year"] ); 

Loe assert eq!("01", &caps["month"]); 

24 assert. eq: UL &caps["day"]); 

25 let after = RE.replace al1("2018-01-01", "Smonth/Sday/Syear") ; 


26 assert eq! (after, "01/01/2018") ; 


Za assert! (regex email ("alex@gmail.com"), true); 
29 assert eq! (regex email ("alex@gmail.cn.com"), false); 
Eds J 


代码 清单 10-10 是 Rust 2015 的 写法 。 代 码 第 1 行 ， 使 用 了 # 
[macro_use] extern crate lazy_static ， 是 因为 需要 使 用 lazy_static 包 中 害 
义 的 lazy_static! 7%. #[macro_use]#J U\#lextern crate lazy_static 写 成 两 
行 ， 未 来 #[macro_use] 或 可 省 略 ， 该 属性 的 意思 是 导出 包 中 定义 的 宏 。 
当然 ， 在 Rust 2018 F, exten ”crate 语法 可 以 省 略 ， 那 么 相应 的 # 


[macro_use] 也 可 以 省 略 ， 也 丈 是 说 ， 人 代码 第 1 代 和 第 2 行 篆 可 省 略 。 

代码 第 4 一 13 行 ， 使 用 lazy_static! 宏 定义 了 两 个 全 局 静态 变量 RE 和 
EMAIL_RE， 它 们 是 不 同 的 正则 表达 式 。 这 样 一 来 ， 束 只 需要 编译 一 
次 ， 而 不 会 重复 编译 。 之 所 以 把 正则 表达 陈 定 义 为 全 局 静态 杰 量 ， 是 出 
于 编 详 性 能 的 考虑 ， 如 果 访 正则 表达 式 和 被 用 于 循环 匹配 中 ， 那 么 会 降低 
编译 的 性 能 ， 并 且 不 利于 正则 表达 去 引擎 内 部 的 优化 。 

代码 第 14 一 19 行 ， 分 别 定 义 了 regex_date 和 regex_email 方 法 ， 用 来 
匹配 传 入 的 字符 串 。 在 main 函 数 中 ， 则 可 以 方便 地 使 用 它们 。 

当 需 要 全 局 的 容器 时 ， 比 如 HashMap， 也 可 以 使 用 lazy_static 包 。 

首先 使 用 cargo new--bin static_hashmap 命令 创建 新 的 包 ， 然 后 
在 Cargo.toml 中 添加 lazy_static 依 赖 ， 再 修改 src/main.rs 代 码 ， 如 代码 清 
单 10-11 所 示 。 

代码 清单 10-11: 修改 新 创建 的 static_hashmap 包 中 的 src/main.rs 代 
位 


20 


23» 
26. 
Ala 


#[tiacro üsse] extern crate lazy static; 
mod static kv { 
use std::collections::HashMap; 
use std::sync::RwLock; 
pub const NF: & static sty = “not found"; 
lazy static! { 
pub static ref MAP: HashMap<u32, &'static str> = { 
let mut m = HashMap: :new(); 
m. insert (0, TTO") j} 
m 
by 
pub static ref MAP MUT: RwLock<HashMap<u32, &'static str>> 
{ 
let mut m = HashMap: :new(); 
m:insert(0s “bear”)y 
RwLock: :new (m) 


pi 


Ch, read kvi) { 
let Set ñm = static KV? MAF? 
assert. eq! ("foo", *m.get.(&0) .unwrap or(&static kv::NF)); 
assert eq! (static kvithF, 
*m.get(&1).unwrap or(&static_ kv::NF)); 
fn. rw mut _kv() => Result<(), String> 1 


Li s Let. M = SLL kerri MAP MOT 


£9. read().map err(|e| eto string()) ir 

304 assert eq! ("bar", *m.get(&0).unwrap or(&static kv::NF)); 
Cale } 

oe s { 

Os let. mut m = static kv: :MAP MUT 

34. Write O map srr(|el Sto string() iti 

25% M: Tt “Gag ji 

30. } 

Bhs Ok(()) 

36% | 


A9,. TO. fait) g 
40. read kv(); 


41. match rw mut kv() { 

42. ORI) Sr | 

43. Ler. il = Scare KIF iMP NUI 

44. Tead) -MAp EEF (| | &. t0 string () ) .unwrap (); 

4. assert eq! ("baz", *m.get (él) unwrap or(estatic kyvs:NE)); 
46. hy 

i Err(e) => {println! ("Error {}", e)}, 

48. } 

49. } 


在 代码 清单 10-11 中 ， 代 码 第 1 行 ， 同 样 是 通过 ##[macro_use] extern 
crate lazy_static 引 入 包 和 lazy_static! ZH). 

代码 第 2 一 19 行 ， 使 用 mod 关 键 字 定义 了 static_kv 模 块 。 和 模块 是 Rust 
模块 化 编程 的 基础 ， 其 作用 域 是 独立 的 、 封 闭 的 ， 在 static_kv 中 定义 的 
向量 或 方法 默认 是 私有 的 。 所 以 ， 和 想 要 在 模块 外 调用 模块 中 的 稼 量 或 方 
1A, WMI pub 关键 字 将 可 见 性 改 为 公开 的 。 

所 以 ， 代 码 第 3 行 和 第 4 行 ， 使 用 use 引 入 了 std: : collections 和 
std: : sync 模 块 ， 使 用 其 中 定义 的 HashMap 和 RwLock， 只 对 模块 
static kv WX. 

代码 第 5 行 ， 使 用 pub const 定 义 了 公开 的 普通 章 量 NEFE， 它 和 是 一 个 字 
从 串 字 和 面 量 类 型 。 如 果 想 在 模块 外 使 用 它 ， 束 必须 带 上 命名 空间 ， 也 整 


是 模块 的 名 字 : static hash: : NF. 
代码 第 6 一 18 行 ， 使 用 lazy_static! 宏 定 义 了 两 个 全 局 静态 变量 MAP 
和 MAP_MUT， 分 别 代 表 只 读 的 HashMap 和 可 变 的 HashMap。 
lazy_static! 宏 的 语法 格式 如 代码 清单 10-12 所 示 。 
代码 清单 10-12: lazy_static! 宏 的 语法 格式 
le tagy State! 4 
2 [pub] static ref NAME 1: TYPE 1 = EXPR 1; 
oe [pub] static ref NAME 2: TYPE 2 = EXPR 2; 
4 
3 


[pub] static ref NAME N: TYPE N = EXPR N; 
om } 

在 使 用 lazy_static! 宏 时 ， 必 须 严 格 按照 此 语法 格式 来 书写 ， 否 则 
Sz 5] GRE RS ic o 

回 到 代码 清单 10-11 中 ， 代 码 第 7 一 11 行 ， 定 义 了 一 个 不 可 变 (只 
BE) 的 HashMap 类 型 的 全 局 静态 变量 MAP， 并 插入 了 一 个 初始 化 的 键 值 
对 “{0: "foo" }”. 

代码 第 12 一 17 行 ， 定 义 了 可 变 〈 可 读 可 写 ) 的 RwLock<HashMap 
<u32, &’ static _ str 之 > 类 型 的 全 局 静态 变量 MAP_MUT。 注 意 ， 这 里 
使 用 了 RwLock 读 写 锁 来 包装 HashMap， 这 是 因为 可 能 会 有 多 个 线程 来 
访问 HashMap， 而 HashMap 并 没有 实现 Sync， 所 以 HashMap 不 是 线程 安 
全 的 类 型 。 因 此 ， 必 须 使 用 同步 锁 来 保护 HashMap， 让 其 线程 安全 。 其 
实 也 可 以 使 用 Metux 互 斥 锁 来 傈 护 HashMap， 它 们 的 区 别 在 于 : 

 RwLock 谈 写 锁 ， 是 多 读 单 写 锁 ， 也 叫 共享 独占 锁 。 它 允许 多 个 线 
程 谈 ， 单 个 线程 号 。 但 是 在 与 的 时 候 ， 只 能 有 一 个 线程 占有 写 锁 ; 而 在 
谈 的 时 候 ， 人 允许 任意 线程 获取 读 锁 。 谍 锁 和 写 锁 不 能 被 同时 获取 。 

: Metux 互 斥 饥 ， 只 人 允许 单个 线程 谈 和 写 。 

所 以 在 谈 数 据 比 较 频 索 远 远大 于 与 数据 的 情况 下 ， 使 用 RwLock 旋 
写 锁 可 以 给 程序 谤 来 更 高 的 并 发 文 持 。 在 第 11 章 中 还 会 对 它们 做 更 详细 
的 介绍 。 

作为 全 局 静态 变量 ， 希望 MAP_MUT 希望 用 于 多 读 单 写 的 场景 
中 ， 所 以 这 里 使 用 了 RwLock 谈 与 锁 。 


代码 第 20 一 25 行 ， 定 义 了 read_kv 函 数 。 在 该 函数 内 部 ， 使 用 了 
static_kv: : MAP 来 获取 static_kv 模块 中 定义 好 的 全 局 静态 变量 MAP, 
如 果 不 加 命名 空间 static_kv， 则 无 法 访问 到 MAP。 

代码 第 21 行 ， 使 用 了 ref 模式 匹配 来 获取 static_kv: : MAP 的 引 
用 mm， 也 可 以 直接 使 用 &static_kv:， : MAP 来 获取 引用 m。 代 码 第 22~ 
24 行 ， 通 过 对 m 解 引用 ， 得 到 其 内 部 的 HashMap 类 型 ， 并 使 用 get 方 法 来 
获取 存储 于 MAP 中 的 初始 键 值 对 。 这 里 使 用 get 方 法 来 获取 HashMap 指 
定 刍 的 值 ， 是 一 个 很 好 的 工程 实践 ， 因 为 get 方法 会 返回 Option<T> 
类 型 。 如 果 没 有 获取 到 ， 则 会 返回 None， 或 者 是 指定 的 其 他 值 ， 比 如 
该 行 中 的 &static_kv: : NEFE， 这 样 更 有 利于 错误 处 理 。 也 可 以 直接 使 用 
*xm[&0] 这 样 的 写法 ， 但 它 返 回 的 是 &T KW, WRA LAERE, 

代码 第 26 一 38 行 ， 定 义 了 rw_mnut _kv 国 数 ， 该 图 数 返 回 一 个 Result 到 

O ，String> 关 型 。 在 该 函数 中 使 用 的 是 static_kv: : MAP_ MUT 全 
局 静态 变量 ， 它 的 类 型 实际 上 是 RWLock 二 HashMap 三 u32,，&’ static str 
>>>>。RwLock 该 写 锁 提供 了 read 和 write 方法 来 获取 读 锁 和 写 锁 。 

注意 ， 在 函数 rw_mut_kv 中 ， 使 用 了 代码 氛 对 read 和 write 进行 了 陋 
离 ， 如 代码 第 27 一 31 行 以 及 代码 第 32 一 36 行 所 示 。 这 是 因为 读 锁 和 写 锁 
不 能 被 同时 获取 。 只 有 了 放 到 代码 氛 中 ， 才 能 让 该 饥 和 与 锁 得 到 释放 ， 
为 Rust 的 RAII 机 制 ， 在 资源 《〈 这 里 是 锁 ) 出 了 作用 域 之 后 会 得 到 释放 。 

如 果 把 代码 块 去 挥 ， 则 会 发 生死 锁 情 况 。 在 Rust 中 ， 叫 作 “ 中 毒 

(Poison) “”。 但 是 ， 如 果 访 函数 中 只 存在 读 的 情况 ， 而 没有 与 ， 则 不 
需要 引入 代码 块 隔 离 ， 因 为 RwLock 是 允许 多 个 线程 同时 读 的 。 同 样 ， 
在 第 11 章 中 会 介绍 更 多 的 相关 内 容 。 

fEmainek 2c, 4) HI VARA fread kv 和 rw_mut kv。 因为 rw_mut kv 
返回 的 是 Result 关 型 ， 所 以 需要 使 用 match 匹 配 处 理 Ok 和 Err 两 种 情况 。 

如 果 写 入 正 篆 ， 那 么 也 可 以 正 篆 谈 取 HashMap 中 写 入 的 值 ; 否则 输出 镑 
Re 

综 上 所 述 ， 就 是 惰性 静态 初始 化 lazy_static 包 的 两 个 使 用 场景 。 另 
外 ， 还 有 两 个 值得 注意 的 地 方 : 

使 用 lazy_static! 宏 定 义 的 全 局 静态 变量 如 果 有 析 构 函数 ， 则 是 不 


SA FAA, AVA RE HAS fin JA HA. 

:在 lazy_static! ZPANAEE MASS ae, AMIS RA 
Eim Ise] A fElazy_static! 宏 中 调用 了 内 部 的 宏 ，Rust XZ RE 
归 调 用 有 调用 次 数 限制 。 可 以 地 过 在 当前 编写 的 包 中 加 上 # ! 
[recursion_limit=" 128 " ] 属 性 修改 上 上限， 默认 值 为 32， 比 如 可 以 修改 为 
128。 

在 不 久 的 将 来 ，Rust 的 CTFE 编译 时 函数 执行 ) 功 能 进一步 完善 
之 后 ， 在 菜 些 场 景 中 也 许 束 不 需要 使 用 lazy_static 包 了 。 

指定 第 三 方 包 的 依赖 天 系 

Rust 包 使 用 的 是 语义 化 版 本 号 (SemVer ) 。 基 本 格式 为 “X.Y.2 
”， 版 本 扎 递 增 规则 如 下 : 

- X, ERAS (major) . 4h SAFA SHITE BIN, 120K 
此 版 本 号 。 

Y, KRES (minor) 。 当 做 了 同 下 莱 容 的 功能 性 修改 时 ， 修 改 
此 版 本 号 。 

Z, Wh (patch) > Hw S E FRAZA AE, EA 
EREE « 

TH CRASS EA T RRA RI AY To el. EE AA SAY 
增长 ， 加 入 的 第 三 方 包 束 会 越 来 越 多 ， 包 之 间 的 依赖 天 系 也 会 越 来 越 复 
AS, BFE MM RIN’ o 

LE Qs Jlazy_statich RUIN, JKE SWRA SS AW1.0.0". RAS ST 
于 “A1.0.0”， 这 意味 着 当 有 新 的 lazy_static 包 发 布 时 ， 人 允许 Cargo 在 主 版 本 
号 不 变 的 情况 下 ， 更 新 次 版 本 号 或 修订 版 本 号 。 比 如 及 布 了 “1.1.02， 那 
么 当 执 行 cargo build 或 cargo run 命 令 时 ， 会 目 动 依赖 最 新 的 “1.1.0" 包 。 

指定 版 本 扎 范 围 的 标记 有 以 下 几 种 : 

AES OA) ， 人 允许 新 版 本 与 在 不 修改 [major，minor，patch] 中 最 
左边 非 零 数字 的 情况 下 才能 更 狐 。 

:通配符 (*) ， 可 以 用 在 [major，minor，patch] 的 任何 一 个 上 面 。 

”波浪 线 (~) ， 人 允许 修改 [major，minor，patch] 中 没有 明确 指定 
的 版 本 号 。 


.手动 指定 A>. >=. <, <=. =R ERES. 
具体 的 示例 如 代码 清单 10-13 所 示 。 
代码 清单 10-13: preg res 


ta = Km FHT 

2. + nae 

Sa | Lae j rl, AS Mes Ua 
4. S| 223 S=1,.2,.0 €2.0.0 
Fa =L se =]: 0,0 €200 

6. “O.2.2 t= S=0.2.3 0.3.0 
Te “0.03 $= 2-00.38 <0.0.24 
8. “0.0 := >=0.0.0 <0.1.0 
P “QO := >=0.0.0 <1.0.0 

10. // 通配符 示例 

11. := >=0.0.0 

LZ, da” ER eel 0 2.8.0 
13s lage*® g= FH-1eZ. 0 lL 
14. // 波浪 线 示 例 

Los Sl Ld 
lta Cla? Be Spelsdl Ss Dad 
17. ~1 := >=1.0.0 <2.0.0 

18. // FABRE 

IS. 2 Ly Zot 

20, > 1 

Zil X 2 


NO 
NO 
Il 
pa 
N 
w 


// 手动 指定 多 个 版 本 
24. pe 1.2, = lef: 


SRB CHAS Zp, Cargo 还 全 面 文 持 git。 可 以 直接 指定 git 仓 
库 地 址 ， 如 代码 清单 10-14 所 示 。 
Wiis 4210-14: 可 以 直接 指定 git 仓 库 地 址 


1. [dependencies] 


NO 
U9 


2. rand = { git = "https://github.com/rust-lang-nursery/rand" } 


当 一 个 包 依 顿 本 地 的 包 时 ， 也 可 以 指定 其 依赖 路 径 。 比 如 在 上 面 创 
建 的 static_hashmap 包 中 ， 又 创建 了 一 个 新 的 包 hello_world， 束 可 以 在 
static_hashmap 的 Cargo.toml 文 件 中 按 路 径 指 定 依赖 关系 ， 如 代码 清 单 10- 
15 所 示 。 

代码 清单 10-15: 可 以 使 用 path 来 指定 本 地 包 hello_world 

1. [dependencies] 
2. hello world = { path = "hello world", version = "0.1.0" } 


注意 ， 在 代码 清单 10-15 中 ，hello_world 是 在 static_hashmap 包 的 根 
目录 下 创建 的 ，path 默 认 的 根 目 录 束 是 static_hashmap 包 有 的 根 目录 。 但 是 
这 种 通过 path 指 定 本 地 依赖 的 包 ， 不 允许 被 发 布 到 crates.io 仓 库 平 侣 上 
面 。 


10.1.3 Cargo.toml x (4% xb 


TOML 文 件 是 通用 的 格式 ， 可 以 用 它 表 示 任 何 配置 格式 。Cargo 也 
有 一 套 专用 的 TOML 配 置 格式 。 现 在 以 第 三 方 包 regex l 作为 示例 来 说 
明 。 代 码 清单 10-16 展 示 了 regex 包 的 目录 结构 。 

代码 清单 10-16: regex 包 的 目录 结构 

regex 
— bench/ 
L eis 
| 一 examples/ 
-一 regex-capi/ 
-一 regex-debug/ 
-—— regex-syntax/ 
-一 scriptsy 
-一 Ses 
— tests/ 


L Cargo.toml 
在 regex 包 里 还 包含 看 另外 四 个 包 ， 分 别 是 bench、regex-capi、 
regeX-debug 和 Tregex-Syntax。 
[package] 表 配置 


现在 打开 Cargo.toml 文件 看 看 相关 配置 。 代 但 清单 10-17 fea S 


regex 包 中 Cargo.toml 文 件 的 [package] 表 配置 。 


(O to =l -65 RD A= Re MN E> 


2 ES 2s 2 YH i 
On ms {02 Bo - cc s 


代码 清单 10-17: regex, F Cargo.toml X 4# H [package] # Ac E. 
[package] 


name = "regex" 
version = "1.0.5" #:version 
authors = ["The Rust Project Developers"] 


license = "MIT/Apache-2.0" 

readme = "README.md" 

repository = "https://github.com/rust-lang/regex" 
documentation = "https://docs.rs/regex" 


homepage = "https://github.com/rust-lang/regex" 


. description = Y=. 
. An implementation of regular expressions for Rust. 
. This implementation uses 


. finite automata and guarantees linear time matching on all inputs. 


. categories = ["text-processing"] 


在 TOML 语 言 中 ，[package] 这 种 语法 叫 作 表 (Table ) 。 在 


[package] 表 里 描述 的 都 是 和 regex 包 有 关 的 元 数据 ， 比 如 包 名 
(name) 、 作 者 “authors) 、 源 但 仓库 地 址 (repository〉、 文 档 地 址 
(documentation) 、 包 功能 的 简要 介绍 〈description) 、 包 的 分 类 
(categories) 等 。 


注意 其 中 的 语法 ， 基 本 都 是 字符 串 。 如 末 古 数组 ， 则 使 用 中 括号 : 


如 果 是 多 上 段 的 文字 ， 则 使 用 三 引号 “" " " ”。 


[package] 表 是 每 个 包 必 不 可 少 的 ， 它 相当 于 代码 清单 10-18 中 拍 述 


的 JSON 格 式 。 


代码 清单 10-18: [package] 表 等 价 于 这 样 的 JSON 格 式 


"package": { 


"name"; "regex", 


1 
Z 
cy "Vereen es MI Weg sy 
4 // 省 略 
5 "categories": ["text-processing"™|] 
6. } 
[badges] K Ac Æ. 
继续 看 regex 包 的 Cargo.toml 文 件 ， 接 下 来 是 [badges] 表 配 置 ， 如 代 
但 清单 10-19 所 示 。 
代码 清单 10-19: [badges] K M E 
1. [badges] 
2. travis-ci = { repository = "rust-lang/regex" } 


3. appveyor = { repository = "rust-lang-libs/regex" } 


在 代码 清单 10-19 中 展示 了 [badges] 表 配置 ， 设 置 了 travis-ci 和 
appveyor。 这 两 项 表 配 置 表示 可 以 在 crates.io 网 站 上 显示 travis-ci 和 
appveyor 的 展示 徽章 。travis-ci 和 appveyor 都 是 云 病 的 持续 集成 服务 平 
台 ， 前 者 支持 Linux 和 Mac ”OS 系统 ， 后 者 支持 Windows 系 统 。 男 外 ， 
[badges] 表 还 文 持 GitLab、codecoy 等 诸多 平台 。[badges] 表 是 一 个 可 选 
表 ， 如 有 果 没 有 持续 集成 服务 ， 则 可 以 不 配置 此 表 。 

[workspace] 表 配置 

接 下 来 是 [workspace] 表 配置 ， 如 代码 清单 10-20 所 示 。 

代码 清单 10-20: [workspace] 表 配置 


1. [workspace] 
2. members = ["bench", "regex-capi", "regex-debug", "regex-syntax"| 
在 代码 清单 10-20 中 ，[workspace] 表 代表 工作 空间 


(Workspace) 。 工 作 空 间 是 指 在 同一 个 根 包 (crate〉 下 包含 了 多 个 子 
包 (crate〉。 在 本 例 中 ， 根 包 束 是 regex， 而 在 代码 第 2 行 ，members 键 
指定 了 bench、regex-capi、regex-debug、regex-syntax 四 个 子 包 。 

工作 空间 中 的 子 包 都 有 自己 的 Cargo.toml 配 置 ， 各 自 独 立 ， 互 不 影 
啊 。 在 根 包 regex 的 Cargo.toml 中 指定 的 依赖 项 ， 也 不 会 影响 到 子 包 。 不 
党 是 编 诺 根 包 还 是 子 包 ， 最 终 的 编译 结果 永远 都 会 输出 到 根 包 的 target 


EKT, FFAS LEZ Ta) A iA 4 Cargo.lock ti. 
[dependencies] # Mt Æ 


继续 看 根 包 regex 的 Cargo.toml 文 件 ， 接 下 来 就 是 [dependencies] 表 配 
置 ， 如 代码 清单 10-21 所 示 。 
代码 清单 10-21: [dependencies] 表 和 [deti-dependencies] 表 配置 


1. [dependencies] 

4, a@no-corasick = "0.6, /" 

3. memchr = "2.0.2" 

$. Ttivedd local = "0.2.6" 

5. regex-syntax = { path = "regex-syntax", version = "0.6.2" } 
6. wucte-ranges = "1.0.1" 

7. [dev-dependencies|] 

S- EY SLALI = 119 

9. quickcheck = { version = "0.7", default-features = false } 
LO. wane = "Qa" 


在 代码 清单 10-21 中 展示 了 [dependencies] ” 表 和 [dev-dependencies] 
表 配 置 。[dependencies] 表 在 前 面 介 绍 过 ， 它 专门 用 于 设置 第 三 方 包 的 依 
赖 ， 这 些 依赖 会 在 执行 cargo ” ”build 命令 编译 时 使 用 。[dev-dependencies|] 
表 的 作用 与 之 类 似 ， 只 不 过 它 只 用 来 设置 测试 Cests) ~ AP 

(Cexamples) 和 基准 测试 (benchmarks) 时 使 用 的 依赖 ， 在 执行 cargo 

test 或 cargo bench 命令 时 使 用 。 

[features] 表 配置 

接 下 来 是 [features] 表 配 置 ， 如 代码 清单 10-22 所 示 。 

AR A AL10-22: [features] 表 配置 


1. [features] 

2. default = | "use sta | 
32 use std = [| 

4. unstable = ["pattern"] 
5 pattern = [] 


在 代码 消 千 10-22 中 ，[features] ” 表 中 的 配置 项 与 条 件 编 详 功能 相 
关 。 在 Rust 中 ， 有 一 种 特殊 的 属性 #[cfg] ， 叫 作 条 件 编译 属性 ， 该 属 
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允许 使 用 std 标 准 库 中 定义 的 Pattern trait， 但 是 该 trait 目 前 还 处 于 未 稳定 
状态 ， 所 以 使 用 了 unstable 配 置 。 

代码 清单 10-23 展 示 了 在 regex 包 中 如 何 使 用 条 件 编 译 属 性 。 

代码 清单 10-23: 在 regex 包 中 使 用 #[cfg] 属 性 

# [cfg (not (feature = "use std"))] 


compile error! ("use std feature is currently required to build this crate"); 


tiefg(feature = "pattern") | 


m= Co BS FF 


mod pattern; 


在 代码 消 日 10-23 中 ， 代 码 第 3 行使 用 了 #[cfg (feature= " pattern 
" ) ] ， 这 意味 看 当 执 行 cargo build--features "pattern" 命令 时 ， 在 
Cargo 内 部 调用 Rust 编译 需 rustc 时 会 传 --cfg feature= " pattern" 标 
记 ， 那 么 在 输出 中 也 会 包 仿 pattern 模 块 ， 否 则 ， 不 会 编译 pattern 模 块 。 

代码 第 1 行使 用 了 #[cfg (not (feature=" use_std" ) ) ] ， 其 作用 
IEG AH [cfg (feature= "use std" ) ] 相反 ， 表 示 在 编译 时 不 指定 
features 参 数 。 

[lib] 表 配置 

继续 看 regex 根 包 的 Cargo.toml 文 件 ， 接 下 来 是 [lib] 表 配置 ， 如 代码 
清单 10-24 所 示 。 

代码 清单 10-24: [lib] 表 配置 

Ls [ | 
2. bench = false 

Mis 10-24 展示 的 [lib] 表 用 来 表示 了 最 终 编译 目标 库 的 信息 ， 访 

表 完 整 的 配置 项 主要 包含 以 下 几 类 : 
name 。 比 如 name= " foo " ， 表 示 将 来 编译 的 库 名 字 

为 "libfoo.a” 或 “libfoo.so” 等 。 

- crate-type 。 比 如 crate-type=[" dylib " " staticlib " ]， 表 示 可 以 
同时 编译 生成 动态 库 和 毅 态 库 。 

- path 。 比 如 path= " src/librs" ， 表 示 库 文件 入 口 ， 如 果 不 指定 ， 
则 默认 是 SrcVlib.rs。 


-test 。 比 如 test=true， 表 示 可 以 使 用 单元 测试 。 

bench 。 比 如 bench=true， 表 示 可 以 使 用 性 能 基准 测试 。 

还 有 其 他 配置 项 ， 这 里 就 不 一 一 列举 了 。 在 本 例 中 ， 因 为 根 包 中 没 
有 有 提供 性 能 基准 测试 ， 所 以 将 bench 设 置 为 false。 

[test] 表 配置 

接 下 来 是 [[test]] 表 配 置 ， 注 意 到 该 表 由 两 个 中 括号 舱 登 表示， 这 在 
TOML 语 言 中 代表 表 数 组 ， 如 代码 清单 10-25 所 示 。 

代码 清单 10-25: [[test]] 表 配置 


Le [ltesty | 
Zs path = “tests/test default.rs"™ 
Se Tame = “detault” 
4. [ [test] ] 
5. path = "tests/test default bytes. re” 
6. name = "default-bytes" 
Tx [es 
8. path = "tests/test nfa.rs" 
2. hae = "pra" 


在 代码 清早 10-25 中 列举 了 三 组 [[test]] 表 配置 ， 这 只 是 regex 根 包 中 
Cargo.toml 配 置 的 一 部 分 。 这 三 组 [[test] 表 表示 一 个 数组 ， 等 价 的 JSON 
格式 如 代码 清单 10-26 所 示 。 

代码 清单 10-26: [[test]] 表 数组 等 价 的 JSON 格 式 


lige 4 

2 wast s | 

3 t "Baca: "sss r Dam ys "we f 
4 { "path » “tenes Maer” fy 
5 I PROCUL: Wisi” p “Reames “ema” fy 
人 要 ] 

Ta } 


可 以 得 出 ，[[test]] 表 数组 表示 的 是 同一 个 数组 中 的 三 组 不 同 配置 。 
[[test]] 表 支持 的 配置 项 和 [ib] 表 基本 相同 。 
[profile] 表 配置 


接 下 来 是 [profile] 表 配置 ， 如 代码 清单 10-27 所 示 。 
代码 清单 10-27: [profile] 表 配置 


1. [profile.release] 
2. debug = true 

i. [profile.bench] 
4. debug = true 

Fy [profile.test] 

6. debug = true 


Cargo 文 持 目 定义 rustc 编 详 配置 ， 使 用 [profile] 表 进行 配置 即 可 ， 但 
只 对 根 包 中 的 profile 配 置 有 效 。 

在 代码 清单 10-27 中 ， 在 [profile] 表 中 使 用 了 点 CO PRS SRNR 
E, 4y%|7[profile.release]. [profile.bench]#[profile.test], 5 LSE (7 Wy 
JSON# SK 如 代码 清单 10-28 所 示 。 

代码 清单 10-28: [profile] 表 配置 对 应 的 JSON 格 式 


1 


rae "release": { "debug": "true"}, 
Sy "bench": { "debug": "true"}, 
Bis "test" {i "debug": “true” jy 

oe } 


这 三 项 表 配 置 分 别 代 表 Release. Bench 和 Test 编译 模式 。 除 此 之 
Sh, Cargo ”还 支持 [profile.dev] 代 表 Debug 模 式 。 在 本 例 中 ， 当 前 的 配置 
代表 在 Release、Bench 和 Test 模 式 下 ， 均 包 偏 Debug 信息 。 除 debug 配 置 
项 之 外 ， 还 文 持 用 于 指定 优化 级 别 的 opt-level、 连 接 时 间 优 化 的 lto 等 。 

快速 浏览 了 一 遍 根 包 的 Cargo.toml 配 置 文件 ， 大 概 了 解 到 这 些 配置 
表 的 作用 。 接 下 来 看 看 子 包 bench 中 的 Cargo.toml 文 件 。 

子 包 bench 的 目录 结构 如 代码 清单 10-29 所 示 。 

代码 清单 10-29:， 子 包 bench 上 的 目录 结构 


bench 
| 一 log/ 
| 一 区 
-一 Cargo.toml 
-一 buila.xrs 
| 一 compile 
— run 
Bench 子 包 用 来 和 其 他 语言 编写 的 正则 表达 式 引 擎 比较 性 能 基准 测 
wo Œ log 文件 夹 里 你 存 的 是 兽 经 的 测试 记录 。src 目 录 是 Rust 包 结构 的 
原生 目录 。Cargo.toml 是 Cargo 的 配置 文件 。build.rs 叫 作 构建 脚本 
(Build Script) ， 它 是 先 于 cargo build 被 编译 的 脚本 ， 因 为 有 时 候 需 要 
在 编译 时 依赖 第 三 方 非 Rust 人 代码， 比如 C 库 ， 这 时 融和 需要 先 编译 C 库 ， 然 
后 Rust 代 但 才能 链接 到 C 库 。 关 于 build.rs， 在 第 12 章 中 还 会 做 更 详细 的 
介绍 。compile 和 run 是 shell 脚 本 ， 分 别 包装 了 cargo build 和 cargo bench 命 
令 ， 用 于 更 方便 地 执行 基准 测试 。 
现在 查看 子 包 bench 的 Cargo.toml 文 件 ， 如 代码 清单 10-30 所 示 。 
代码 清单 10-30: 子 包 bench 中 的 Cargo.toml 文 件 部 分 配置 


[package] 

a = ee 

Je build = "build. rsg” 

4. workspace = ".." 

> [ [bin] ] 

6. name = "regex-run-one" 
Te path = “srce/main.rs” 
8. bench = false 

Sp [ [bench] ] 

10. name = "bench" 

11. path = "src/bench.rs" 


12. test = false 
13. bench = true 
代码 清单 10-30 只 展示 了 之 前 没有 见 到 过 的 Cargo.toml 文 件 的 部 分 配 
置 ， 因 为 大 部 分 配置 和 根 包 regex 中 的 Cargo.toml 文 件 一 致 。 


iS 1~447, [package] 表 中 有 两 个 键 值 对 配置 项 build 和 
workspace。 其 中 build 用 于 设置 构建 脚本 ， 这 里 直接 指定 build.rs， 因 为 
默认 的 根 路 径 殉 是 当前 包 Cbench) 的 根 目 录 ， 而 build.rs 正 好 位 于 当前 
包 的 根 目 录 下 。workspace 和 根 包 (regex) P Cargo.toml H [workspace] % 
配置 相 呼 应 ， 这 里 设置 了 两 个 点 “.. ”， 表 示 workspace 是 当前 包 根 目录 的 
上 一 层 目 录 。 

代码 第 5 一 8 行 的 [[bin]] 表 和 第 9 一 13 行 的 [[bench]] 表 以 及 上 面 提 到 的 
Lib] 表 的 配置 项 是 相同 的 。 当 想 在 一 个 作为 库 的 包 里 同时 包谷 
main.rs 〈 可 执行 程序 的 入 口 main 函 数 ) 时 ， 束 需要 配置 [[bin]] 表 。 这 里 
配置 项 name 表示 生成 的 可 执行 文件 的 名 字 ; path 表示 当前 包含 入 口 
main 函 数 的 文件 路 径 。 如 果 想 把 该 入 口 文件 直接 置 于 src 目 隶 下， 则 文件 
名 必须 是 main.rs; 如 果 想 用 其 他 文件 名 ， 则 必须 将 其 放 到 src/bin 目 录 
下 。 这 里 配置 项 bench 被 设置 为 false， 就 是 希望 在 生成 可 执行 文件 时 不 
会 去 执行 基准 测试 。 同 理 ， 可 推出 [[bench]] 表 中 配置 的 含义 。 

至 此 ， 对 子 包 bench 中 Cargo.toml 文 件 的 配置 也 有 了 比较 全 面 的 了 
解 。 天 于 时 多 的 细 广 ， 可 以 参考 crates.io 网 站 上 更 评 细 的 文档 。 


10.1.4 目 定 义 Cargo 


Cargo 人 允许 修改 本 地 配置 来 目 定义 一 些 信 息 ， 比 如 命令 别名 、 源 地 
址 等 。 默 认 的 全 局 配置 位 于 “$sHOME/.cargo/config” 文 件 (基于 Linux/ 类 
UNIX 系统 ， 如 果 是 Windows， 则 为 %USERPROFILE%\.cargo\config) 
中 。 其 体 的 配置 信息 如 代码 清单 10-31 所 示 。 

代码 清单 10-31: $HOME/.cargo/config 配 置信 息 


[registry] 

token = “your crates 10 token” 

[source.crates-i0] 

registry = "https://github.com/rust-lang/crates.io-index" 
[alias] 

b = "build" 

t = "test" 


r= “TUT 


Oo GO: ~l © Oe GS Re FE 


| 
C s 


rr = "run --release" 
. ben = "bench" 
. Space example = ["run", "--release", "--", "\"command list\""] 


代码 清单 10-30 展示 了 Cargo 配置 文件 的 部 分 配置 信息 ， 可 以 看 
出 ， 配 置 语 言 同 样 是 TOML 。 其 中 [registry] 表 代 表 crates.io 的 相关 配 
置 ， token 是 在 crates. io 上 注册 账号 以 后 由 网 站 颁发 的 ， 用 于 开 肥 者 在 及 
布 包 〈crate) 时 通过 平台 验证 。 

[source.crates-io] 表 表 示 Cargo 的 源 是 crates.io。registry 配 置 项 指定 
了 crates.io 的 索引 文件 地 址 。 GitHub 是 默认 配置 ， 如 果 无 法 访问 
GitHub， 则 可 以 通过 指定 其 他 的 源 来 解决 问题 ， 其 体 可 参考 附录 A 中 的 
Je 

T [alias] 表 中 可 以 指定 Cargo 各 种 命令 的 别名 ， 以 方便 使 用 。 甚 至 
还 能 定义 比较 复杂 的 组 合 命令 ， 如 代码 第 11 行 所 示 ， 当 执行 cargo 
space_example 命 令 时 ， 实 际 上 会 执行 cargo run--release--command list 命 


一 一 
+ 


Cargo 配 置 文件 的 层级 天 系 说 明 

Cargo 配 置 文件 和 git 到 不 多 ， 文 持 层级 的 概 仿 。 也 束 是 说 ， 可 以 进 
行 全 局 配置 ， 也 可 以 针对 有 具体 的 项 目 〈 包 ) 进行 配置 ， 如 下 所 示 。 

“ 所 有 用 户 的 全 局 配置 : /.cargo/config 

当前 用 户 的 全 局 配置 ; $HOME/.cargo/config 

. 根 包 regex 的 配置 : /regex/.cargo/config 

- 子 包 bench 的 配置 : /regex/bench/.cargo/config 

Cargo 配 置 会 从 上 到 下 层 层 缆 盖 ” ， 上 下 层 的 配置 并 不 会 相互 影响 


。 假 如 在 子 包 bench 中 定义 了 cargo ”build 的 别名 为 “cargo bu”, MWA 
bench 根 目录 下 执行 cargo build. cargo bu, cargo b 命 令 中 的 任意 一 个 都 
是 可 以 的 。 回 到 根 包 regex 中 执行 cargo bu 命令 则 不 行 ， 但 依然 可 以 执行 
cargo build 和 cargo b 命 令 。 

H E X Cargo f Me 

Cargo 允许 日 定义 命令 来 满足 一 些 特殊 的 需求 。 只 要 在 $SPATH 

(环境 变量 ) 中 能 查 到 以 “cargo -为 前 绥 的 二 进 制 文件 ， 比 如 cargo- 

something， 就 可 以 通过 cargo something 来 调用 该 命令 。 比 如 ， 在 日 常 开 
发 中 专门 用 于 格式 化 Rust 代 码 的 第 三 方 Cargo 扩 展 rustftmt， 束 是 这 样 来 扩 
展 Cargo 命 令 的 。 

可 以 通过 下 列 命 令 来 安 六 rustfmt。 

稳定 版 (Stable) Rust: rustup component add rustfmt 


Ah (Nightly) Rust: rustup component add rustfmt--toolchain 

nightly 

通过 执行 cargo--list 命 令 来 人 租 看 当前 可 用 的 全 部 命令 ， 束 可 以 发 现 多 
了 一 个 fmt 命 令 ， 然 后 就 可 直接 调用 cargo fmt 令 来 格式 化 Rust 文 件 。 比 如 
在 前 和 面 创建 的 static_hashmap 包 的 根 目录 下 执行 cargo fmt 命令 ， 则 会 对 
src/main.rs 重 新 格式 化 ， 同 时 还 会 生成 srcmain.rs.bk 文 件 作为 备份 。 一 般 
在 团队 开发 中 多 使 用 此 Cargo 扩 展 ， 不 管 每 个 团队 成 员 的 编码 风格 是 盏 
一 致 ， 只 需要 在 提交 代码 前 执行 一 过 cargo fmt 命 令 ， 束 可 以 统一 整个 团 
队 的 编码 风格 。 如 果 有 些 地 方 不 想 被 rustftmt 处 理 ， 那 么 只 需要 在 该 处 上 
方 添加 井 [rustfmt_skip] 属 性 即 可 。 

打开 rustftmt 涯 但 中 的 Cargo.toml 文 件 ， 会 看 到 如 代码 清单 10-32 所 示 
的 配置 。 

代码 清单 10-32: rustimti) £5 Cargo.toml xt (FW) #847 Ac E. 


*ruscimc”™ 


iar Lint 


"rustfimt-format-dift" 


Oo nv om & WwW NHN - 
oO 
fH 

I ff = 7. = i 


. name ‘ob Pus trie 


从 代码 清单 10-32 中 可 以 看 出 ，[[bin]] 表 数组 一 共 配 置 了 四 个 可 执行 
文件 的 名 字 ， 其 中 包括 了 cargo-ftmt， 用 户 通 过 cargo install fit S 2248 
rustftmt 之 后 束 目 动 拥有 了 cargo fmt 命 令 。 与 这 四 个 可 执行 文件 相对 应 ， 
在 rustfmt 源码 中 的 src/bin 目录 下 有 四 个 Rust 文件 ， 分 别 是 rustfmt.Ts、 
cargo-fmt.rs. rustfmt-format-diff.rs 和 git-rustfmt.rs， 因 此 在 [[bin]] 表 数组 
下 没有 使 用 path 来 设置 文件 路 和 任 。 

除了 可 以 直接 使 用 rustfmt 堵 认 的 代码 风格 ， 还 可 以 通过 在 包 的 根 目 
录 下 添加 rustfmt.toml 文 件 来 自 定义 代码 风格 ， 代 码 清单 10-33 展 示 了 一 
份 日 定义 的 格式 化 配置 供 参 考 。 

代码 清单 10-33: rustfmt.toml 配 置 


1. # 最 大 宽度 

2. max width = 90 

3. # fn BREE 

4. fn call width = 90 

5. + 链 式 调用 一 行 最 大 宽度 

6. chain one line max = 80 

7. $ 压缩 通配符 前 组 

8. condense wildcard suffixes = true 


天 村 更 多 的 配置 ， 可 以 参考 rustfmt 的 相关 文档 。 


FAX, Cargo 还 提供 了 两 个 在 开发 中 相当 有 用 的 工具 : cargo-fix 和 
cargo-clippy。 其 中 cargo-fix 提供 了 cargo fix 命令 ， 可 以 为 开发 者 目 动 修 
复 编译 过 程 中 出 现 的 Warning。cargo-dlippy 是 Rust 静 态 代 人 码 分 析 工 具 ， 
其 提供 了 cargo dlippy 命 令 ， 帮 助 开 发 者 检测 代码 中 潜在 的 错误 和 坏 味 
ia, IFA MRust 1.29 版 本 开始 可 用 于 Rust 稳 定 版 中 。 


10.2 模块 系统 


Rust 冒 方 团队 豆 励 开发 者 在 开发 包 (crate〉 的 时 候 ， 尺 可 能 做 到 最 
小 化 。 也 就 是 说 ， 每 个 包 都 应 该 尽量 只 人 负 贡 单一 的 完整 功能 。 有 些 第 二 
方 包 ， 人 代码 量 比较 少 ， 只 需要 单个 文件 《比如 srclib.rs) 融 能 完成 整个 
功能 。 有 些 包 代 码 量 却 很 多 ， 可 以 写 在 单个 文件 中 来 实现 整个 功能 ， 但 
是 不 利于 维护 。Rust 是 一 门 文 持 模 块 化 的 语言 ， 对 于 代码 量 比较 大 的 
包 ， 可 以 将 其 按 文 件 分 割 为 不 同 的 模块 ， 这 样 可 以 更 合理 地 组 织 代 码 。 

在 单个 文件 中 ， 可 以 使 用 mod 关键 字 来 声明 一 个 模块 。 在 
static_hashmap 包 中 ， 束 使 用 mod 关 键 字 声明 了 static_kv 模 块 。 在 Rust 中 
单个 文件 同时 也 是 一 个 默认 的 模块 ， 文 件 名 就 是 模 块 名 。 每 个 包 痢 拥有 
一 个 项 级 (top-level ) 模块 srclib.rs 或 src/main.rs 。 

Rust 2015 模块 

现在 对 static_hashmap 包 按 Rust 2015 的 模块 系统 规则 进行 重 构 。 先 
将 在 src/main.rs 中 定义 的 static_ kv 模块 移动 到 新 的 文件 static kv.rs 中 。 文 
件 结 构 如 代码 清单 10-34 所 示 。 

代码 清单 10-34: 文件 结构 

Srey 


| -一 main.rs 


| L— static kv.rs 


此 时 需要 将 main.rs 中 的 mod static kv{...} 整 块 代 人 码 移 动人 到 static_kv.rs 
中 ， 但 要 注意 把 mod 声 明 去 近 ， 如 代码 清单 10-35 所 示 。 


代码 清单 10-35: J static_kü fk RRI 5) Bllstatic_kii.rs (4 F 


mS Doe] Oo Co s to PO f= 


= e = 
N He O » 


Les 


/{ SEC/Starie kis 


use std::collections::HashMap; 


use std::sync: :RwLock; 


nub const NF: €'static Str = "Nok Teuna"; 


lazy static! | 


pub static ref MAP: HashMap<u32, &'static str> = | 
let mut m = HashMap: :new(); 
i.risert (0, Doss 
m 
$ 
pub static ref MAP MUT: RwLock<HashMap<u32, &'static str>> = 
{ 
let mut m = HashMap: :new(); 
minsern(d, "Bary; 
RwLock: :new (m) 


bi 


如 代码 清单 10-35 所 示 的 是 static_kv.rs 文 件 中 的 代码 ， 这 里 已 经 去 抒 
了 之 前 的 mod 声 明 。 这 十 因为 Cargo 会 默认 把 static_kv.rs 文 件 当 作 一 个 酝 
块 static_kv， 如 果 加 上 之 前 的 mod 声 明 ， 那 么 在 main.rs 中 调用 该 模块 中 
定义 的 常量 或 静态 变量 时 ， 则 需要 改 成 static_kv: : static kv: : MAP 
或 &static kv: : static kv: : NF 这 样 的 形式 。 这 束 相 当 于 有 了 两 层 命 
TE, HERK FIAME. 

要 想 在 main.rs 中 使 用 新 定义 的 static_kv.rs 文 件 ， 还 需要 使 用 mod 关 
键 字 引 入 static_kv 模 块 ， 如 代码 清单 10-36 所 示 。 

代码 清单 10-36: 在 main.rs 中 使 用 mod 关 键 字 引入 static_kui 模 块 


Oo OO =] A OFF &S W N FF 


: 


ff Mian 

#[macro use] 

extern crate lazy static; 

mod static kv; 

En. read Kyv() { 
Ee see 

} 

cn. WW mut_kv() = Result<(); String> 1 
fi ws 

} 


+ Tn Maint) 4 


PF eas 
} 


在 代码 清单 10-36 中 ， 人 代码 第 4 行使 用 mod 关 键 字 引入 了 static_kv 模 


块 ，Cargo 会 


目 动 查找 到 static_kv.rs 文 件 。 其 他 代码 不 变 ， 故 这 里 省 略 。 


现在 main.rs 文 件 中 的 另外 两 个 函数 read_kv 和 rw_mut_kv， 同 样 可 以 
被 帮 到 独立 的 文件 中 。 在 src 目 录 下 创建 一 个 新 的 文件 read_func.rs， 然 后 
把 这 两 个 函数 都 移动 到 这 个 新 文件 中 ， 如 代码 清单 10-37 所 示 。 

代 但 清单 10-37: 将 read_kii 和 rw_mut_kui 丙 个 函数 从 main.rs 中 移 
动 到 read func.rs 中 


1. // read func.rs 

4x MSE static pyy 

Sy pub En read kyt) 1 

4 ISt EL m = statis eve Mae, 

Ts assert eq! ("foo", *m.gqet(e0) .unwrap or(&static kyv:2NF) ) ; 
6 assert eq: 

7 static kv::NF, *m.get(&l).unwrap or(&static_ kv: :NF) 
8 ) ; 

Se J 

tUs pub fn rw mot ky() => Result<(), String> 4 

|i { 

Le let. f = slalil KeSiMaAP MoT 

L3. ead(). tap errie] S.t string ()) 2? 

14. assert. eq! ("bar", “meget (40) .unwrap or({éstatic kve:NE))? 
13s } 

ia { 

Leds let, mut m = statie Rv: MAP MUT 

LG y Write () Map exr(|e| eto strang()) fs 

13s MeInSsercil, "Daz" 

20. } 

le Ok(()) 

ae d 


代码 清单 10-37 展 示 了 将 read_ kv 和 rw_mut_kv 这 两 个 水 数 移动 到 
read_func.rs 中 以 后 能 够 正 稼 编译 的 最 终 修 改 代 码 。 注 意 跟 之 前 的 代码 不 
同 的 地 方 一 共有 三 处 。 

因为 在 这 两 个 函数 中 均 用 到 了 static_kv 模块 中 定义 的 常量 或 静态 变 
量 ， 所 以 需要 引入 static_kv 模块 。 但 是 因为 在 顶级 模块 main.rs 中 已 经 
使 用 mod 关键 字 引 入 过 了 了， 所 以 在 read_func.rs 中 只 需要 使 用 use 直 接 打 
开 模 块 即 可 ， 如 代码 第 2 行 所 示 。 这 是 其 中 一 处 变化 。 

另外 两 处 变化 是 ， 在 read_kv 和 rw_mnut_kv 函 数 前 面 都 加 上 pub% 
键 字 ， 它 表示 public (公开 的 ) 。 这 是 因为 每 个 模块 对 外 都 是 封闭 的 ， 
在 模块 中 定义 的 一 切 都 是 私有 的 ， 只 有 通过 琴 加 pub 才 可 修改 其 可 见 
性 ， 变 为 对 外 可 公开 访问 ， 如 代码 第 3 行 和 第 10 行 所 示 。 


然后 ， 在 main.rs 中 退 过 mod 天 键 字 引入 read_func 模 块 ， 如 代 人 清早 
10-38 所 示 。 


代码 清单 10-38: 在 main.rs 中 引入 read func 模块 


// main.rs 

# [macro use] 

extern racte lazy Static; 

mod static ky}? 

mod read_func; 

use read func::{read kv, rw mut kv}; 
fn main() { 


PE iw 


WO On © U &S W DN H 


a ft 

代码 清单 10-38 展 示 了 main.rs 文 件 的 最 终 修 改 代 但 。 人 代码 第 5 行 ， 通 
过 mod 关 键 字 引入 了 read_func 模 块 。 代 人 码 第 6 行 ， 使 用 use 关 键 字 来 打开 
read_func 模 块 ， 引 入 其 中 的 read_kv 和 rw_mut_kv KG SEE U E 
在 main 冰 数 中 使 用 这 两 个 疯 数 了 (之 前 的 代 人 不 需要 修改 ) ; 否则 ， 必 
须 在 main 国 数 中 用 到 这 两 个 函数 的 地 方 加 上 命名 空间 ， 比 如 
read func: : read kv 和 lread func: : rw mut kv. 

OPE, TEER A A. mains LAF F ARIB E BI PAS 
独立 的 文件 中 ， 代 人 码 结构 变 得 更 加 清晰 。 接 下 来 ， 在 static_hashmap 的 根 
目录 下 执行 cargo run 命 令 ， 代 人 码 可 以 正音 编译 和 运行 。 

现在 src 目录 下 一 共有 三 个 独立 文件 ，main.rs、read_func.rs 和 和 
static kv.rs。 但 实际 上 static kvrs 和 read_ func.rs 在 逻辑 层面 上 并 不 独立 ， 
前 者 定义 了 静态 变量 MAP 和 MAP_MUT， 后 者 定义 了 操作 它们 的 读 写 行 
为 。 基 于 这 种 考虑 ， 应 该 把 static kv.rs 和 read func.rs 合并 为 同一 个 模 
块 。 那 么 应 该 如 何 做 呢 ?” 把 它们 归 到 同一 个 文件 里 吗 ? 答案 是 否定 的 。 
其 实 完 全 可 以 把 这 两 个 文件 放 到 同一 个 文件 夹 下 来 达成 目的 ， 如 代码 清 
单 10-39 所 示 。 

代码 清单 10-39: 将 static kii.rs 和 和 read func.rs 放 到 同一 个 文件 夹 下 


Static hashmap 


— srce 

| — main.rs 

| L— static func 

| -—— mod.rs 

| 上 一- read. Tune.2s 
| L— static kv.rs 
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static_kv.rs 和 read_func.rs 置 于 其 中 ， 然 后 创建 了 新 的 文件 nod.rs。 此 
有 时，static_func 束 可 以 作为 一 个 模块 来 使 用 ，Cargo 会 目 动 查 找 该 文件 夹 
下 的 mod.rs 文件 作为 该 模块 的 根 文 件 。 现 在 只 需要 在 mod.rs 中 引入 
static_kv 和 read_func 两 个 模块 即 可 ， 如 代码 清单 10-40 所 示 。 

代码 清单 10-40: 在 mod.rs 中 3 引入 static_kti 和 read_func 模 块 


1. // src/static func/mod.rs 
2. pub mod static kv; 
3. pub mod read func; 


在 代码 清单 10-40 中 使 用 mod 天 键 字 引入 了 static_kv 和 read_func 模 
块 ， 并 通过 pub 关 人 键 字 将 其 设置 为 对 外 公开 。 
但 是 现在 还 无 法 通过 编译 ， 使 用 cargo ”build 命令 编译 时 会 报 出 如 下 
AUR: 
error [E0432]: unresolved import static ky 
i sre/static tfunc/read Tune rsidzs 
1 | Use Static kv; 


ee re no ‘static kv in the root 


在 read_func.rs 中 ，use static_kv 这 行 会 报错 ， 人 错误 信息 表明 无 法 在 根 
(root) 目录 下 找到 static_kv。Cargo 查找 文件 是 从 包 的 根 日 录 开 始 的 ， 
而 不 是 当前 文件 的 相对 目录 。 想 解决 这 个 错误 ， 只 需要 将 use static_kv 修 
改 为 use super: : static kv, WEA; LAKH static kv. FERRE _E 1 A super% 
键 字 ， 可 以 让 Cargo 以 相对 路 径 的 方式 得 找 文件 ，super 代 表 当 前 文件 的 

上 一 层 目 杂 。 
还 需要 修改 main.rs， 如 代码 清单 10-41 所 示 。 


代码 清单 10-41: 修改 main.rs 

// main.rs 

#[macro use] 

extern erate lazy static; 

mod static func; 

use static funes sstatic_kv; 

use static func: :read func::{read_ kv, rw_mut_kv}; 


fn main() { 


f ws 
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在 代码 清单 10-41 中 ， 代 人 码 第 4 行 ， 使 用 mod 关 键 字 引入 T static_func 
人 模块。 代码 第 5 行 和 第 6 行 ， 通 过 use 关 键 字 打 开 static_func: : static kv 
和 static_func: : read func 两 个 模块 供 main 了 水 数 使 用 ，main 了 水 数 之 前 的 
代码 依然 不 雷 要 修改 。 

最 后 将 Cargo.toml 文 件 中 的 edtion 修 改 为 “2015”。 此 时 使 用 cargo run 
命令 可 以 正 第 编译 和 运行 。 可 以 通过 随 书 源码 中 的 static_hashmap_2015 
包 来 全 看 完整 代码 。 

经 过 这 一 系列 午 构 ， 我 们 大 概 可 以 了 解 到 ，Rust 中 的 模块 可 以 按照 
类 似 于 文件 系统 的 方式 进行 组 织 ，Cargo 会 根据 文件 名 即 模块 名 的 默认 
约定 来 查找 相关 模块 。 

Rust 2018 模 块 

Rust 2018 对 模块 系统 进行 了 改进 ， 主 要 包括 下 面 内 容 : 

不 再 需要 在 根 模块 中 使 用 extern crate 语 法 导入 第 三 方 包 。 

:在 模块 导入 路 径 中 使 用 crate 关 键 字 表 示 当 前 crate。 

:按照 特定 的 规则 ，mod.rs 可 LAA ER - 

Use 语句 可 以 使 用 骸 倒 风格 来 导入 模块 。 

下 面 通过 再 次 重 构 static_hashmap_2015 项 目 来 说 明 Rust 2018 中 模块 
系统 的 变化 。 首 先 使 用 cargo new 命令 创建 新 的 项 有 目 
static_hashmap_2018 “”， 人 然后 打开 Cargo.toml 文 件 添加 依赖 的 第 三 方 包 
lazy_static， 注 意 此 时 edtion 选 项 默认 为 “2018”。 

现在 重新 审视 static_hashmap_2015 项 目 中 的 static_func 目 录 下 的 


read_func 和 和 static_kv， 发 现 它 们 之 间 还 存在 一 层 依 赖 天 系 。 在 main.rs 中 
用 的 是 read_func 中 的 图 数 ， 而 read_func 义 依赖 于 static_kv。 其 实在 
static_hashmap_2015 项 目 中 并 没有 很 好 地 反映 出 这 一 层 关 系 。 
现在 使 用 Rust ”2018 的 新 模块 系统 来 修改 。 在 static_hashmap_2018 
项 目的 src 目 录 下 创建 read_func.rs 文 件 ， 同 时 创建 read_func 上 目录， 并 在 此 
目录 下 创建 static_kv.rs 文 件 。 此 时 src 目 录 结 构 如 代码 清单 10-42 所 示 。 
Ris 10-42: src 目 录 结 构 


-一 erg 
| |- 一 main.rs 


| -一 read fung 
| | L— static kv.rs 


| L— read func.rs 


代码 清单 10-42 所 示 的 结构 明确 地 反映 出 read_func 和 static_kv 的 关 
系 。 在 Rust 2018 中 ， 如 末 存 在 与 文件 同名 的 目录 ， 则 在 该 目录 下 定义 的 
模块 都 是 鹰 文 件 的 子 模块 。 也 束 是 说 ， 在 当前 项 目 中 ，read_funcrs 和 
read_func 目 好 是 同名 的 ， 所 以 定义 在 read_func 目 录 下 的 static_kv 模 块 束 
是 read_func 的 子 模块 。 注 意 ， 在 Rust 2015 中 则 不 允许 文件 与 目录 间 名 。 

同时 ， 在 read func.rs 艾 件 中 需要 使 用 mod 关 键 字 引入 static kv 模 
块 ， 如 代码 清单 10-43 所 示 。 

代码 清单 10-43: 在 read func.rs 文 件 中 引入 static ki 模块 

1. pub mod static_kv; 


2 pub fn read kv() { 

3 // F static hashmap 2015 项 目 内容 

4. } 

5 pub fn rw mut kv() => Result<(), String> { 
6 // Fl static hashmap 2015 项 目 内 容 


Ta } 


在 代码 清单 10-43 中 省 略 了 read kv 和 rw mut kv AAJ, H 
图 数 体 等 同 于 static_hashmap_2015 项 目 中 对 应 内 容 。 需 要 注意 ， 人 代码 第 1 
行 和 直接 引入 了 static_kv 模 块 ， 并 未 加 其 余 的 路 径 前 缀 。 这 说 明 Rust 会 通 
过 mod 关 键 字 上 自动 到 当前 read_func 模 块 的 子 模块 中 寻找 static_kv 模 块 。 


接 下 来 修改 static_kv.rs 文 件 ， 如 代码 清单 10-44 所 示 。 
代码 清单 10-44: 修改 read func/static kii.rs 文 件 


Ls 


JI om od W N 


use lazy Static:iilazy static; 
use std::collections::HashMap; 
use std::sync::RwLock; 
Dub const NF? &' Static str = "not Teuna" 
lazy static! { 
// 同 static hashmap 2015 项目 内 容 
} 


在 代码 清单 10-44 中 同样 省 略 了 lazy_static! 宏 的 具体 代码 。 该 文件 
主要 的 变化 是 代码 第 1 行 ， 使 用 use 关键 字 引 入 了 lazy_static 包 中 的 
lazy_static! 宏 。 如 果 不 加 这 一 行 ， 则 无 法 使 用 lazy_static! 宏 。 因 为 在 


Rust 


2018 中 ， 可 以 在 项 目的 根 模 块 下 也 就 是 main.rs 中 省 略 ## 


[macro_use] extern crate lazy_static ， 但 是 在 具体 使 用 到 lazy_static! 安 
的 模块 时 瓯 必须 使 用 use 引 入 。 

接 下 来 修改 main.rs 文 件 ， 如 代 但 清单 10-45 所 示 。 

代码 清单 10-45: 修改 main.rs 文 件 


ba MOG Lead. Tune; 

2a use crate:s:read func::{read ky; rw mut ky}; 

ae EU Maint) i 

4. read Kv (); 

Bis match rw mut _kv() { 

6. ORL)? => | 

Ts let m = read Tuncesstatic ky:sMAP MUT 

is -ES () 

9a Map @re(|e| Ste SEELNG (J) . Unwrap |) ; 
LU a assert egi "baz", 

Lis *M.get (E1) sunwrar or (read. Tune: : statie NE 
Is ) ; 

Le. 

Lethe Ere(e) => printlint ("Error {}"p €), 

| } 

证 


在 代码 消 日 10-45 中 ， 使 用 mod 关 键 字 引入 J 了 read_func 模 块 。 相 比 于 
static_hashmap_2015 项 目 中 的 main.rs 文件 ， 代 码 要 清晰 很 多 ， 可 读 性 更 
高 。 另 外 ， 代 码 第 7 行 ， 调 用 static_kv 模 块 中 的 静态 变量 MAP_MUT 需 
要 使 用 read_func 表 缀 ， 又 一 次 体现 了 这 种 层次 天 系 。 

另外 ， 在 代码 第 2 行 中 ，use 语 句 使 用 了 crate KTW, MRKI 
入 的 是 当前 crate 中 定义 的 read_func 模块 。 当 然 ， 此 处 也 可 以 使 用 self 
关键 字 来 代 符 crate KEF, Rust 会 以 main.rs 为 起 点 寻找 当前 相对 路 径 
下 的 read_func 模 块 。 如 果 是 第 三 方 包 ， 则 不 需要 写 crate 表 级 。 这 样 也 可 
以 提高 代码 的 可 读 性 。 


10.3 从 去 开始 实现 一 个 完整 功能 


通过 对 Cargo 包 管理 和 模块 系统 的 和 学习， 我 们 现在 完全 有 能 力 写 一 
个 具有 完整 功能 的 包 。 以 2017 年 C++17 编 码 挑 战 赛 为 例 ， 用 Rust 来 实现 
mma 

JE Pkg EE: 编写 一 个 命令 行 工 具 ， 可 以 接收 一 个 CSV 文 

tf, ATH HE E E RERA oe Ta ESIA ai» PARE R a 

到 新 的 CSV 文 件 中 。 原 始 CSV 文 件 内 容 如 代码 清单 10-46 所 示 。 

代码 清单 10-46: 原始 CSV 文 件 内 容 

First Name,Last Name,Age,City,Eyes color,Species 

John, Doe, 32, Tokyo, Blue, Human 

Flip,Helm, 12, Canberra, Red, Unknown 

Terdos, Bendarian,165,Cracow,Blue,Magic tree 

Domi, RIDOS, 25, Paris, Pirole, Ore 

Brad, Doe, 42, Dublin, Blue, Human 

Ewan,Grath,51,New Delhi, Green, Human 


然后 执行 如 下 命令 


> ./your program input/challenge.csv City Beijing output/output.csv 


your_program 为 编译 后 的 可 执行 程序 ， 其 接收 三 个 参数 ， 分 别 是 字 
段 名 《〈City) ~ ZBAWI (Beijing) 和 输出 的 文件 名 
(output/output.csv) 。 执 行 命 令 后 ， 输 出 文件 内 容 如 代码 清单 10-47 所 
不 。 

代码 清单 10-47: 蔡 换 后 的 CSV 文 件 内 容 

First Name,Last Name,Age,City,Eyes color,Species 

John, Doe, 32, Beijing, Blue, Human 

Flip,Helm, 12,Beijing, Red, Unknown 

Terdos, Bendarian,165,Beijing,Blue,Magic tree 

Dominik, Hlpos,33,Beij ing, Purple, Ore 

Brad, Doe, 42, Beijing, Blue, Human 

Ewan, Grath,51,Beijing, Green, Human 


可 以 看 到 ，City 字 上 段 下 面 的 所 有 值 都 被 符 换 成 了 Beijing。 挑 战 题 其 
实 很 徐 单 ， 本 意 是 想 让 参与 者 完全 用 C++17 的 新 特性 来 完成 。 借 用 此 
时， 现在 用 Rust 来 实现 。 


10.3.1 使 用 Cargo 创 建新 项 目 
现在 使 用 Cargo 命 令 来 创建 新 的 二 进 制 项 目 csv_challenge。 


$ cargo new --bin csv challenge 
此 时 会 生成 标准 的 包 目 录 ， 主 要 文件 包括 src/main.rs 和 
Cargo.toml。 进 入 csv_challenge 目 录 中 ， 在 根 目录 下 创建 input 文 件 来 ， 
然后 在 该 文件 夹 下 创建 一 个 challenge.csv 文 件 ， 将 原始 CSV 文 件 内 容 复 
制 到 其 中 。 再 回 到 csv_challenge 根 目录 下 ， 创 建 一 个 空 文件 来 output， 
用 于 存放 将 来 输出 的 CSV 文 件 。 此 时 包 的 目录 结构 如 下 : 
csv_ challenge 

-一 Cargo.toml 

-一 input 

| — challenge.csv 


— output/ 
L src 


L— main.rs 


接 下 来 要 考 谍 的 是 如 何 从 命令 行 接收 参数 。 基 本 电路 有 两 种 : A 
接 使 用 std: > env: : args 和 使 用 第 三 方 包 。 本 者 的 方式 比较 原始 ， 还 
证 要 手动 解析 参数 ， 所 以 这 里 使 用 第 三 方 包 、。 


10.3.2 使 用 structopt 解 析 命 令 行 参数 


可 选 的 第 三 方 包 有 两 个 : clap 和 structopt。 其 中 dlap 的 功能 非常 强 
大 ， 但 是 使 用 起 来 没有 那么 直观 ， 而 structopt 则 是 在 clap 基 础 上 构建 而 成 
的 ， 简 化 了 操作 。 所 以 这 里 选用 structopt 包 。 打 开 Cargo.toml 文 件 ， 加 入 
PB IK: 


1. [dependencies] 
Z. Structospt = Sk. an 
3. Struceopt=-derive = "0.2" 


然后 运行 cargo _ build 命令 ， 从 crates.io 〈 或 指定 的 国内 源 ) 下 载 并 编 


译 安 装 这 两 个 包 。 因 为 structopt 是 基于 过 程 宏 (Procedural Macro) 的 ， 
所 以 它 需 要 依赖 structopt-derive 包 。 关 于 过 程 宏 会 在 第 12 半 中 介绍 。 


根据 structopt 的 用 法 ， 需 要 一 个 结构 体 来 封 闻 所 需要 的 参数 。 为 了 


模块 化 ， 在 src ” 根 目 录 下 创建 新 的 文件 optrs。 此 时 csv_challenge 包 的 目 
KAUN P : 


WO =) œ OT ee Gs bo Fe 


esv_challenge 

Cargo . bom 

input 

—— challenge.csv 
output / 

sre 


上 -一 6pL. rs 


L— main.rs 

在 opt.rs 文 件 中 创建 结构 体 Opt， 如 代码 清单 10-48 所 示 。 
代码 清单 10-48: 在 src/opt.rs 文 件 中 创建 结构 体 Opt 
USS SCruero us, derive it; 


# [derive (StructOpt, Debug) ] 


#[{[structopt (name = “csv challenge", about = "Usage”) | 


ET TT 


DOD BF Opt 4 
#[structopt (help = "Input file") ] 
pub inputs; String, 
#[structopt (help = "Column Name") ] 
pub column name: String, 
#[structopt (help = "Replacement Column Name") ] 
pub replacement: String, 
#[structopt (help = "Output file, stdout if not present") |] 
DUD uthat: Oprion<srring=, 


在 代码 清单 10-48 中 定义 的 结构 体 Opt 专 门 用 于 构建 如 下 命令 : 
USAGE: 


csv challenge [FLAGS] <input> <column name> <replacement> [output] 


说 明 如 下 : 

-csv_challenge ， 为 编 详 后 的 可 执行 文件 。 

` [FLAGS] ， 为 Flag 参 数 ， 一 般 是 侧重 于 表示 “ 开 ” 和 “天” 的 标记 。 

-<input> ， 表 示 输 入 文件 ， 也 就 是 原始 CSV 文 件 路 径 。 它 对 应 于 
代码 第 6 行 的 字段 input， 并 通过 # [structopt...] 属 性 设置 heljp 说 明文 字 。 

- <column_name> ， 表 示 指 定 要 蔡 换 的 CSV 文 件 头 部 字段 。 它 对 
应 于 代码 第 8 行 的 字段 column name. 

. <replacement> ， 表 示 要 蔡 换 的 新 值 。 它 对 应 于 代码 第 10 行 的 字 
段 replacement。 

[output] ， 雪 示 输 出 的 文件 路 径 。 它 对 应 于 代码 第 12 行 的 字段 
output， 注 意 它 为 Option<String 之 关 型 ， 因 为 该 参数 可 以 省 略 ， 由 默认 
的 输出 文件 路 径 代 和 蔡 。 

因为 结构 体 和 字段 都 需要 在 opt 模 块 外 使 用 ， 所 以 在 代码 清单 10-48 
中 使 用 pub 关 键 字 将 它们 的 可 见 性 都 修改 为 公开 。 

接 下 来 修改 sromain.rs 文 件 ， 如 代码 清单 10-49 所 示 。 

代码 清单 10-49: 修改 src/main.rs 文 件 

Le "USS SCRUSEORE DE 
mod opt; 
use self::opt::Opt; 
fn main() { 
let opt = Opt::from args (); 
PELL ("sey p Oe) 


“JO OFF & W N 


, 3 
在 代码 清单 10-49 中 ， 因 为 使 用 的 是 Rust 2018， 所 以 可 以 省 略 使 用 


extern crate #1] #[macro_use] == 4A 5| Astructopt#llstructopt_derive . 现在 可 
以 直接 使 用 use 关 键 字 引入 StructOpt 供 本 地 使 用 。 


代码 第 2 行 和 第 3 行 ， 使 用 mod 和 use 关 键 字 来 引入 Opt 供 本 地 使 用 。 


fEmainek h, (EH structop E peH Opt: : from_args 方 法 就 可 以 接收 
来 日 命令 行 的 参数 。 使 用 cargo run 命 令 编 译 并 运行 ， 会 看 到 如 下 提示 : 
error: The following required arguments were not provided: 
<input> 
<column name> 
<replacement> 
USAGE: 


csv challenge [FLAGS] <input> <column name> <replacement> [output] 
For more information try --help 


此 时 structopt 包 提供 的 方法 会 目 动 检查 命令 行 有 没有 输入 需要 的 参 
数 ， 如 果 没 有 则 给 出 提示 ， 并 目 动 提供 --help 参 数 。 当 执行 cargo run--- 
help 命令 后 ， 会 有 如 下 输出 : 
USAGE: 


csv challenge [FLAGS] <input> <column name> <replacement> [output] 
FLAGS? 


=A; -SL Prints help information 
-V, --version Prints version information 
-v, --verbose 
ARGS: 
<input> Input file 
<column name> Column Name 
<replacement> Replacement Column Name 


<output> Output file, stdout if not present 
structopt 会 根据 Opt 结 构 体 中 的 定义 ， 生 成 这 样 一 份 命令 帮助 清单， 


csv_challenge 包 的 用 法 一 目 了 然 。 在 开始 处 理 接 收 的 参数 之 前 ， 应 该 考 
虚 定 义 统一 的 错误 类 型 。 


10.3.3 定义 统一 的 错误 类 型 
同样 使 用 单独 的 模块 来 定义 错误 类 型 。 在 src 目 录 下 创建 新 的 文件 


src/err.IS， 并 在 其 中 写 入 如 代码 清单 10-50 所 示 的 内 容 。 
代码 清单 10-50: src/err.rs 文 件 内 容 


le Use Std sie; 
2. #[{derive (Debug) ] 


3. pub enum Error { 
4 16 (10 § EFO}, 
5 Program({&“"static str), 
or } 
7 impl From<103 Error?” for Error 1 
8 fn Erontet 26° EE -> Error 1 
3. Error: 2 Lote) 
10. } 
ids J 
12. mpl FROM<S"*SEat1c SEX> For Error i 
13 。 fn fromte: &*static. | 
14. Error: ¿Program (e) 
Los } 
Ls. } 


在 代码 清单 10-50 HEX SMAKK Error， 其 中 包含 两 个 值 ， 即 
Io Cio: : Error) 和 Program (&’ static str) ， 分 别 代 表 VO 错误 和 人 包 日 
号 的 逻辑 错误 。 同 时 实现 了 From， 使 得 WO 错误 和 字符 串 类 型 错误 可 以 
方便 地 转换 为 Error。 然 后 在 src/main.rs 中 将 此 模块 引入 即 可 。 
此 时 csv_challenge 包 的 目录 结构 如 下 : 
csv Challenge 
-一 Cargo. tom 


—— input 


| 一 一 CnalLlenge.cosy 
| 一 output/ 


接 下 来 瓯 可 以 通过 从 命令 行 接收 的 参数 来 谈 取 CSV 文 件 了 。 


10.3.4 读 取 CSV 文 件 


在 src 目录 下 创建 新 的 文件 core.rs 和 文件 夹 core， 所 有 操作 CSV 文 件 
的 代码 都 放 在 这 里 。 人 处 理 CSV 文 件 需 要 两 步 ， 先 读 取 ， 再 按 指 定 的 字段 
和 值 来 巷 换 旧 什 。 把 这 两 步 分 成 两 个 独立 的 文件 ， 即 core/read.rs 和 
core/Wwrite.rs。 此 时 csv_challenge 包 的 目录 结构 如 下 : 


csv Challenge 
|— Cargo.toml 
|— input 
| -一 challenge.csv 
L— output/ 
L— src 
| -一 core 
| | -一 read.rs 
| | |— write.rs 
| -一 core.rs 
| tL err.rs 
| -一 OPC. 5s 
| 


L— main.rs 


接 下 来 修改 core.rs 文 件 ， 如 代码 清单 10-51 所 示 。 
代码 清单 10-51: 修改 core.rs 文件 
1. pub mod read; 
2. pub mod write; 
Sx Use Crave; serr:s Error; 
注意 要 使 用 pub 将 模块 的 可 见 性 修改 为 公开 的 ， 因 为 在 main 函数 
中 要 使 用 模块 中 的 函数 。 男 外 ， 在 read 模 块 中 要 用 到 Error， 所 以 必须 从 
core.rs 中 引入 才 可 以 。 
接 下 来 在 core/read.rs 中 添加 读 取 文件 的 方法 ， 如 代码 清单 10-52 所 


一 和 


外。 
代码 清单 10-52: 在 core/read.rs 中 添加 读 取 文件 的 方法 


use std::path::PathBuf; 

use std::fs::File; 

USE Süper: Error; 

use stds:i0: sprelude: :*; 

fn load ¢sv(csv file: PathBut) -> Result<String, Errer> { 
let tile = read (CST tile) t; 

Ok (file) 


pub fn write csv(csv data: &str, filename: &str) -> Result<(), Error> 


So ot aA Os G NM FF 
OS 
G 
O 


IU 4 

Li; write(csv data, filename) ?; 

12. Ok(()) 

13 | 

14. fn read(path: PathBuf) -> Result<String, Error> { 
l5; let mut buffer = String::new(); 

16, let mut file = open(path) ?; 

Li filė. read to string (émut buffer) ?; 

18. if buffer.is empty() { 

13, return Err("input file missing")? 

20. } 

‘a M Ok (buffer) 

Zen | 

23. fn open(path: PathBuf) -> Result<File, Error> { 
24. let file = File::open (path) ?; 

25. Ok (file) 

20 |} 

27. fn write(data: &str, filename: &str) -> Result<(), Error> { 
28% let mut buffer = File::create (filename) ?; 

29. buffer.write all (data.as bytes ()) ?; 

30. Ok(()) 

> 


在 代码 清单 10-52 中 ， 代 码 第 1 一 4 行 ， 使 用 use 引 入 了 需要 使 用 的 几 
个 标准 库 的 类 型 ， 包 括 std: : path: : PathBuf、std: : fs: : File 和 
std: : io: : prelude: : *。 这 里 需要 注意 的 是 ，Rust 会 为 每 个 包 目 动 


插入 extern crate std， 为 每 个 模块 目 动 插入 use std: : prelude: : v1: : 
*， 所 以 在 任何 一 个 模块 中 都 可 以 直接 使 用 use 来 引入 包含 在 std: : 
prelude: : vi: : * 中 的 模块 H 。 代 码 第 3 行使 用 了 super XF, Æ 
为 了 使 用 在 当前 模块 的 父 模 块 core 中 引入 的 Error。 

Rust 将 文件 路 径 抽象 为 两 种 类 型 : Path 和 PathBuf ， 这 两 种 类 型 
的 关系 有 反 类 似 于 &str 和 String 的 关系 。Path ”没有 所 有 权 ， 而 PathBuf 
有 独立 的 所 有 权 。 通 过 对 路 人 径 进 行 抽象 ， 可 以 让 开发 者 无 视 后 层 操 作 系 
统 的 和 有 寞 ， 统 一 处 理 文件 路 任 。 

在 模块 std: : fs 中 定义 了 操作 本 地 文件 系统 的 基本 方法 ， 并 且 上 所 
有 方法 都 可 以 路 平台 ， 开 及 者 同样 可 以 无 视 操作 系统 的 关 开 而 统一 使 用 
其 中 的 方法 。 这 里 只 用 到 了 File 结 构 体 ， 使 用 其 提供 的 open 和 create 方 法 
来 打开 和 创建 CSV 文 件 。 在 离开 作用 域 的 时 候 ， 文 件 会 目 动 和 梓 天 闭 。 

在 模块 std: : io 中 定义 了 核心 IO 功能 的 trait、 类 型 和 一 些 基 本 方 
法 。 包 括 Read 、Write 、Seek 、BufRead 这 四 个 trait， 是 对 LO 操作 的 
抽象 。 通 过 std: : io: : prelude: : * 可 以 引入 一 些 VO 操 作 中 最 第 见 的 
BEER 

代码 第 5 一 13 行 定义 了 两 个 pub 函 数 : load_csv 和 write_csv， 分 别 用 
于 读 取 和 写 入 CSV 文 件 。 在 这 两 个 函数 中 义 调 用 了 封 效 好 的 独立 函数 
read、open 和 write， 像 这 样 一 个 图 数 只 做 一 件 事 ， 是 一 种 最 佳 实践 。 

接 下 来 就 可 以 在 main.rs 中 使 用 这 两 个 图 数 来 操作 CSV 文 件 了 了 ， 如 代 
伺 清 单 10-53 所 示 。 

代码 清单 10-53: 在 main.rs 中 使 用 load_ cs 和 write cs 函数 来 操作 
CSV 文 件 


CO = oF Oo ws WN F 


PPP PrP PP PP BP © 
OMAN SO， 


DO NM BD 
b S 


NO 
U9 


BO: Ry NM BS NM PN 
© wo ~J] A A S 


SY, 


use SELuctopt: | IEEUGLODL? 

mod opt; 

use opta? OPT? 

mod err; 

mod core; 

use self::ecore:rread:s{load csv, write csv}; 
use std::paths: PathButf ; 

use std::process; 


fn main() { 


let opt = Optistrom. args () 7 
let filename = PathBuf::from(opt.input) ; 
let csv data = match load ¢sv(filename) { 


Ok (fname) => { fname }, 
Err(e) => { 
princin! ("main errors teri", ele 


process::exit(1); 


} 7 
let output file = gopt,output 


Unwrap or ("output/output.cev";.to string ())s 


match write csv(&csv data, &output file) 
Ok(_) => 1 
printini ("write successi"); 
by 
Err(e) => { 
printin! ("main error: {art ", e]; 


process::exit(1); 


在 代码 清 早 10-53 中 ， 引 入 了 所 有 新 洪 加 的 模块 。 


代码 第 11 行 ， 使 用 PathBuf: 


输入 CSV 文 件 路 径 字 符 串 转折 为 PathBuf 关 型 。 


from 方 法 将 存储 于 opt.input 字 段 中 的 


SB 12~1847, KASEI CSV CTF ER 4 filenamef¥ A load_csv PA žk 
中 。 这 里 使 用 match 来 处 理 ljoad_csv 返 回 的 Result 类 型 。 

代码 第 19 行 和 第 20 行 ， 声 明了 output 变 量 绑 定 ， 代 表 输 出 CSV 文 件 
路 径 。 因 为 optoutput 是 可 以 忽略 的 参数 ， 所 以 这 里 使 用 unwrap_or 方 法 
定义 了 默认 的 输出 路 径 。 

代码 第 21 一 29 行 ， 将 读 取 到 的 原始 CSV 文 件 内 容 csv_data 和 输出 路 
径 output_file 传 入 write _csv 方 法 中 来 输出 CSV 文 件 。 这 里 也 需要 使 用 
match 来 处 理 Result， 人 否则 编译 会 及 出 警告 。 

执行 cargo run input/challenge.csv City Beijing 命令 ， 会 看 到 生成 
output/output.csv CF, H W 4 #input/challenge.csv—2X. 

但 是 挑 成 赛 要 求 必须 把 指定 字段 (City) 下 的 所 有 值 都 蔡 换 为 新 值 

(Beijing) 。 于 是 ， 接 下 来 在 core/write.rs 中 添加 用 于 替换 的 函数 。 


10.3.5 Pe CSV CTE HINA A 


符 换 的 基本 思路 是 : 使 用 lines 方 法 将 恋 取 到 的 原始 CSV 字 人 符 串 转换 
为 和 迭代 需 ， 这 样 承 可 以 按 行 处 理 这 些 内 容 了 。 第 一 行内 容 驶 是 CSV 文 
件 的 头 部 ， 将 其 用 有 去 号 分 隔 存储 为 Vec<&str> 数 组 。 通 过 和 指定 的 字 
段 对 比 ， 残 可 以 得 到 要 蔡 换 字段 的 索引 位 置 。 然 后 将 其 他 行 的 字符 串 存 
储 到 新 的 字符 串 中 ， 继 续 通 过 lines 方 法 转换 为 欠 代 需 ， 结 合 前 面 得 到 的 
索引 位 置 逐 行将 换 相 应 位 置 的 值 。 

考虑 到 处 理 蔡 换 同 样 需 要 PathBuf、EFile 和 Error 这 三 种 类 型 的 支持 ， 
为 了 避免 代码 重 复 ， 现 在 将 引入 这 三 种 类 型 的 代码 移动 到 core.rs 文 件 
中 ， 如 代码 清单 10-54 所 示 。 

代码 清单 10-54: 修改 core.rs 和 core/read.rs 文 件 


// core.rs 

pub mod read; 

pub mod write; 

Hse Eales FSFE! ELEOL: 

use std::{ 
Paths i PScneue , 
fs::File, 
10::{Read, Write}, 


O © wx] dD U SP WN H 


上 一 
EH è 


F 
// core/read.rs 

11. use super::{Error, PathBuf, File, Read, Write}; 

在 代码 清单 10-54 中 ， 将 在 core/read.rs 中 引入 的 std 模 块 都 移出 来 ， 此 
处 使 用 了 Rust 2018 狐 模块 系统 支持 的 use 语 句 内 骸 语 法 。 在 修改 core.rs 的 
同时 ， 也 需要 修改 core/read.rs， 通 过 super 前 缀 从 父 模块 中 引入 要 使 用 的 
ZR AY 

接 下 来 修改 core/write.rs 文 件 ， 如 代码 清早 10-55 所 示 。 

代码 清单 10-55: 修改 core/write.rs 文 件 

1. use super::*; 


2. pub fn replace column (data: String, column: &str, replacement: &str) 


3 -> Result<String, Error 1 

4 let mut lines = data.lines(); 

5 let headers = lines.next().unwrap(); 

6. let columns: Vec<&str> = headers.split(',').collect(); 

7 let column number = columns.iter().position(|&e| e == column) ; 
8 let column number = match column number { 

9 Some (column) => column, 

10. None => Err("column name doesn’t exist in the input file")? 
i pi 

Lis let mut result = String::with capacity (data.capacity ()); 

Les result.push str(&columns.join(",")); 

14. result.push('\n'); 

LD 。 for line in lines { 

is let mut records: Vec<&str> = line.split(',').collect(); 

Lis records[column number] = replacement; 

ik:p result.push str(&records.join(",")); 

Le. result.push('\n'); 

20 s } 

Zl, Ok (result) 

Aa d 


在 代码 清单 10-55 中 ， 代 码 第 1 行 ， 同 样 使 用 了 use spuer: : * 来 引入 
父 模块 core 中 的 类 型 。 

代码 第 2 行 定 义 的 pub 函 数 replace_column 接 收 三 个 参数 : 读 取 到 的 
原始 CSV 字 符 串 data、 指 定 的 字段 column 和 要 匹配 的 新 值 replacement。 

代 但 第 4 一 11 行 ， 通 过 lines 方 法 将 data FAAR AS, I H — 
次 next 方 法 ， 得 到 CSV 文件 的 头 部 headers。 然 后 通过 split 方法 用 逗号 
分 隔 将 headers 转换 为 Vec<g&str 之 数组 columns， 束 可 以 通过 position 方 
法 获取 到 指定 字段 的 索引 位 置 column_number。 使 用 match 匹 配 position 
方法 的 租 找 结 有 末 ， 因 为 有 可 能 输入 的 字段 是 不 存在 的 。 

代码 第 12 一 20 行 ， 创 建 了 一 个 可 变 的 新 字符 串 result， 将 头 部 数组 
columns 使 用 join 方 法 转换 为 用 逗号 分 隔 的 字符 串 ， 加 上 换行 从。 然后 将 
剩余 的 lines 按 行 迭代 ， 每 一 行 先 转换 为 Vec 二 &str 二 可 变数 组 records， 
用 通过 column_number 将 指定 位 置 的 值 蕉 换 为 新 值 replacement。 取 后 将 
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AF o 
代码 第 21 行 ， 返 回 最 终结 果 。 
现在 就 可 以 在 main 函 数 中 使 用 replace_column 方 法 了 ， 如 代码 清单 
10-56 所 示 。 
代码 清单 10-56: 在 main. 函 数 中 使 用 replace_column 方 法 
SF ere 
use self::core:: { 
read: i {load csv, write osv}, 
write::réeplace column, 
}; 
fn main() { 


fT anias 
let modified data = match 


replace column(csv data, éopt.column name, é&opt.replacement) 


Oo m=] CO Cl d= CF FO FO 


Ls Ok(data) => { data }, 
12. Err(e) => { 
Las DEINES ("Main SeFor? TET", 8) i 
14. process: rexit (1); 
ihe } 
16% F 
17. PE E 
LS match write csv(&modified data, output file) 4 
19. tt pisman 
ZU s } 
Ele F 


代码 清单 10-56 展 示 了 main.rs 中 需要 修改 的 部 分 。 代 码 第 2 一 5 行 ， 
使 用 use 引 入 core 模 块 中 的 子 模 块 read 和 write。 


代码 第 8 一 16 行 ， 使 用 replace_column 方 法 蔡 换 原始 CSV 内 容 并 生成 
新 的 修改 过 的 内 容 modified_data。 


代码 第 18 行 ， 将 修改 过 的 内 容 modified_data 写 入 output_file 中 。 


执行 cargo run input/challenge.csv City Beijing 命令 ， 会 看 到 在 生 
成 的 output/output.csv 文 件 中 City 字 段 下 的 所 有 值 均 被 修改 成 Beijing。 大 
功 告 成 ! 


10.3.6 进一步 完善 包 


里 然 代 人 码 功能 基本 可 用 ， 但 如 果 公 开 给 别人 使 用 的 话 ， 则 还 缺少 一 
些 必 要 的 测试 和 文档 。 接 下 来 束 为 csv_challenge 包 增加 一 些 测 试 和 文 
档 。Rust 支 持 四 种 测试 : 单元 测试 、 文 档 测 试 、 集 成 测试 和 基准 测试 
。 其 中 基准 测试 专门 用 于 性 能 测试 。 

增加 单元 测试 

Rust 人 允许 在 文件 中 使 用 mod test 为 相关 功能 提供 单元 测试 。 现 在 为 
load_csv 函 数 增 加 单元 测试 ， 如 代码 清单 10-57 所 示 。 

代码 清单 10-57: 为 load_csi 函 数 增 加 单元 测试 


le Eg (Cast) ] 

4x mod test 4 

ce use std::path::PathBuf; 

4. Use superset load Dov 

ae # [test] 

Ga fn test valid load esv() { 

Ta let filename = PathBuf::from("./input/challenge.csv"); 
Da ler cesy data = load osv (CLLename) ; 
Don assert. (csv data, 1S ok()); 

10. } 

Lbs d 


在 代码 清单 10-57 中 ， 代 码 第 1 行 的 #[cfg (test) ] ”表示 只 有 在 执 
行 cargo test 时 才 编 译 下 面 的 模块 。 

代码 第 2 行 定义 了 了 test 模块， 其 中 通过 use 引 入 了 PathBuf 和 ]load _csv， 
售 则 PathBuf 和 1load_csv 函 数 无 法 在 test 模 块 中 使 用 。 

代码 第 5 ÍT H [test] 属性 表示 其 标识 的 图 数 为 测试 函数 ， 人 否则 为 
普通 的 函数 。 如 果 想 忽略 此 测试 水 数 ， 只 需要 在 #[test] 属 性 下 和 面 再 洪 加 
# [ignore] 属性 即 可 。 


RAS OTT FEM SWRA. ERR, OW eR BS BR FECA PRAY 
规定 。 

执行 cargo test 会 看 到 正常 的 测试 输出 。 限 于 篇 幅 ， 这 里 只 为 
load_csv 增 加 测试 疯 数 ， 同 理 ， 还 可 以 为 write_csv 和 replace_column 77 
法 增加 单元 测试 。 可 以 在 随 书 源码 中 查看 csv_challenge 包 的 完整 源码 及 
测试 代 人 码 。 

增加 集成 测试 

有 时 候 只 有 单元 测试 还 不 够 ， 还 需要 增加 集成 测试 来 测试 包 的 整体 
功能 。 但 是 Rust 对 于 二 进 制 包 是 不 能 增加 集成 测试 的 ， 因 为 二 进 制 包 只 
能 独立 使 用 ， 并 不 能 对 外 手 供 可 调用 的 函数 。 当 前 csv_challenge 包 是 二 
进 制 包 ， 需 要 将 其 改造 一 下 。 

为 了 文 持 集成 测试 ， 只 需要 新 增 Srclib.rs 文 件 ， 将 所 有 的 模块 都 引 
入 其 中 ， Ff aR Bs HY Ip A 以 调用 的 函数 ， OR fa fEmain.rs H val FA ax EE pk Ar BY 
可 ， 如 代码 清单 10-58 所 示 。 

代码 清单 10-58: 新 增 srclib.rs 文 件 

L. MOG Opt; 


2. mod err; 

3. mod core; 

4. // SREB 

So. Bub Use SELE: OBE * ODL: 

a pub use self::core::{ 

Ty read::{load esv, write csv}, 
8. write::replace column, 

2 } 


在 代码 清单 10-58 中 ， 分 别 引 入 了 opt、err 和 core 模 块 。 

代码 第 5 一 9 行 ， 使 用 了 叫 作 重 新 导出 ” (Re-exporting)〉 的 功能 ， 这 
是 为 了 简化 外 部 调用 的 导出 路 入， 而 且 也 不 需要 对 外 骏 露 模块 。 

然后 修改 mian.rs 文 件 ， 如 代码 清单 10-59 所 示 。 

代码 清单 10-59: 修改 main.rs 文 件 


le EF arar 

Žž USE Structopt.s :StructOpt: 
34 use csv challenge: s { 

4. pts 

Dis {load csv, write csv}, 
6. replace column, 

le SG 

8. use std::path::PathBuf; 
9. use std: :process; 

Ia AF yh ee es 

ll. fn maint) { 

12 iE kismis 

Lss | 


Wisi 10-59 展示 了 main.rs 文件 中 需要 修改 的 部 分 。 代 人 码 第 3 
行 ， 通 过 引入 库 包 csv_challenge 来 使 用 其 中 暴露 的 图 数 。 

值得 注意 的 是 ， 这 种 main.rs 配 合 lib.rs 的 形式 ， 是 二 进 制 包 的 最 佳 实 
EK o 

如 果 使 用 cargo ”build 命令 编译 正常 ， 就 可 以 增加 集成 测试 了 。 在 
csv_challenge 包 的 根 目 录 下 创建 tests 文 件 夹 ， 在 其 中 创建 
integration_test.rs 文 件 。 同 时 ， 在 input 目 录 下 创建 一 个 非法 的 CSV 文 件 
no_header.csv， 将 去 挥 头 部 的 CSV 内 容 复 制 到 其 中 ， 用 于 测试 异 稼 情 
Dlo 

此 时 csv_challenge 包 的 目录 结构 如 下 : 


csv_challenge 
-—— Cargo.toml 
-一 一 input 
| -一 challenge.csv 
| 上 -一 no header.csv 


— output/ 
L— src 
| | 一 core.rs 
| | — read. Es 
| | — write.rs 
ee 
| -一 DEE 
| 上- 一 LDE 
| |— main.rs 
L— tests 
| L— integration test.rs 
接 下 来 在 integration_test.rs 中 增加 集成 测试 ， 如 代码 清单 10-60 所 
ZN o 
代码 清单 10-60: integration_test.rs 中 增加 集成 测试 


1 # [cfg (test) ] 

2 mod test 1 

3 use std! paths :PathBbut; 
4. use chy Challenge: si 

Ds Cot, 

6 (lead csv, write csv), 
7 replace column, 

8 

9 


iF 


#[test] 
LD fn test csv challenge’) { 
| ie let filename = PathBuf::from("./input/challenge.csv") ; 
ia let csv data = load csv (filename) ,unwrap (); 
Le assert (csv data.1s 6Ok()); 
14. let modified data = replace column [ 
Lo csv data, "City", "Beijing" 
Ls ) .unwrap (); 
lo assert! (modified data.1s ok()); 
LS 。 let output file = write csv( 
18 émodified data, "“output/test.csv" 
ZY ); 
Bk i assert! (output file.is BRC) 
a2 « } 
Low J 


ERARE, BRAMAN S Foote AL, EBAWEN SA 
Jay PEW Ae Bee A DE al LE. fet {Tcargo test 命令 就 
可 以 运行 集成 测试 ， 因 为 Cargo 可 以 自动 识别 tests 目录 。 

增加 文档 和 文档 测试 

Rust 文 持 通 过 注释 来 生成 文档 ， 以 及 在 文档 中 进行 测试 ， 如 代码 清 
单 10-61 所 示 。 

代码 清单 10-61: 为 core/read.rs 中 的 write _ csda 国 数 增 加 文档 


/// # Usage: 

/// “~ ` ignore 

/// let filename = PathBuf::from("./files/challenge.csv") ; 
/// let csv data = load csv(filename) .unwrap (); 

/// let modified data = replace column ( 

Age csv data, "City", "Beijing") .unwrap () ; 

/// let output file = write csv(&modified data, "output/test.csv") ; 
/// assert! (output file.is ok()); 

pjp sas 

10. pub fn write csv(csv data: &str, filename: gestr) 

lls =} Result<(), Error 


im O0 w & Ca tes to ho tf 


Lee 4 

L3. write(csv data, filename) ?; 
14. Ok (() ) 

oe 2 


代码 清单 10-61 展 示 了 为 国 数 write _csv 增 加 文档 。 普 通 的 注释 使 用 
两 个 斜 杜 YW/ ) ， 而 文档 注释 使 用 三 个 和 斜 枉 WW ) 。 在 文档 注释 中 支持 
Markdown 语法 ， 但 是 如 果 机 增加 代码 块 ， 则 需要 指定 语言 ， 如 果 没 有 
定语 言 ， 则 默认 会 将 其 识别 为 Rust 代 码 ， 并 日 会 执行 文档 测试 。“/1/ 
”会 为 其 注释 下 方 的 语法 元 素 生成 文档 。 

比如 代码 第 2 行 ， 如 果 将 ignore 去 挥 ， 则 在 执行 cargo test 命令 时 注 
释 中 的 代码 会 被 当成 Rust 代码 执行 ， 如 果 去 挥 “ ”语法 ， 则 生成 代码 
时 无 法 高 有 党 显示 。 因 为 在 前 面 已 经 为 write_csy 增加 了 单元 测试 ， 这 里 残 
没 必要 再 进行 测试 了 ， 所 以 使 用 “ignore” 可 以 在 编译 时 忽略 这 段 代 码 
的 文档 测试 属性 ， 只 用 来 生成 文档 。 

也 可 以 使 用 “/! ”在 包 的 根 模块 或 任意 模块 文件 顶部 增加 模块 级 文 
档 ， 如 代码 清单 10-62 所 示 。 所 谓 模 块 级 文档 ， 是 指 为 整个 模块 而 不 是 
单独 为 其 下 方 的 语法 元 素 生 成 文档 。 

代码 清单 10-62:， 在 srcwlib.rs 中 增加 模块 级 文档 


1. //! This is documentation for the CS7 challenge” lib crate 
ie gH 

3. //! Usage: 

ae ff, TT 

Bc ayi use csv challenge: { 

Gs. ff! Ont, 

Te PF {load csv, write csv}, 

Bs VF! replace column, 

a. ff! }; 

LO. Ay] 


在 代码 清单 10-62 中 ， 在 src/lib. RRI DREA “1 ”增加 了 模 
块 级 文档 ， 所 以 在 执行 cargo test 命令 时 文档 注释 中 的 代码 不 会 被 作为 
文档 测试 执行 。 

现在 执行 cargo doc 命令 ， 则 会 在 target/doc 下 根据 文档 注释 生成 相 
天 的 文档 ，UI 界面 和 标准 库 文档 是 一 样 mje 

增加 性 能 基准 测试 

Rust 也 支持 性 能 基准 测试 ， 在 csv_challenge 包 的 根 目 录 下 创建 
benches 目录 ， 该 目录 是 基准 测试 的 默认 目录，Cargo 可 以 目 动 识别 。 

创建 benches/file_op_bench.rs 文 件 ， 在 其 中 写 入 如 代码 清单 10-63 所 
示 的 内 容 。 

代码 清单 10-63: benches/file_op_bench.rs 文 件 内 容 


l1. #![feature (test) ] 

2. extern crate test; 

3. use test::Bencher; 

ke Se Stat? paths: PatnButr; 

Jo use CSy Challenge: <1 

or Opt, 

Ta iload csv; write csv}, 

Bin replace column, 

Se dy 

10. #[bench] 

ll fn bench read 100times(b: &mut Bencher) I 

12. Biter || { 

La let. ù = test: black box (100) ; 

14. (Quon) stolda (0, | e [ftest load. esy {]20}) 
Lis }); 

16. } 

Lis iA best. load Cow) 

Lg, let filename = PathBuf::from("./input/challenge.csv") ; 
L3, load csv (filename); 

Eie d 


HE HHRMA, 4208 H H [features (test) ] . JER, RAE 
Rust 夜 版 下 才 可 使 用 features 功 能 。 需 要 使 用 extern crate 导 入 test 包 ， 此 处 
不 能 省 略 。test: : Bencher 提 供 了 iter 方 法 ， 它 接收 闭 包 作为 参数 。 如 果 
要 与 性 能 测试 代码 ， 那 么 只 要 将 其 放 到 该 团 包 中 即 可 。 

代码 第 11 一 16 行 ， 创 建 beanch read 100timeses 2x, EH # [bench] 
属性 对 其 标注 ， 表 示 这 是 一 个 基准 测试 函数 。 在 iter 方法 的 财 包 参数 
FH, EH test: : black_box (100) 3K ffi tei Atest_load_csveki|201007% 
AN RE BE OGY 2), A DA BOA EE HN LH load_csv eA ANE RE JA 
后 用 fold 方 法 调用 test_load_csv 国 数 100 次 ， 如 代码 第 14 行 所 示 。 

使 用 cargo bench 命令 执行 基准 测试 ， 可 以 看 到 类 似 于 下 面 这 条 内 
容 的 输出 : 


test bench read 100times ... bench: 1,321,230 ns/iter (+/- 699,240) 


AAR 2ll crates.io 

现在 可 以 把 具有 完整 功能 的 包 发 布 到 crates.io 和 平台。 首先 需要 注册 
crates.io 网 站 的 账号 ， 登 录 之 后 在 个 人 主页 里 生成 一 个 Api Token， 将 此 
Token 配 置 到 .cargo/config 的 [registry] 表 下 面 ， 然 后 使 用 cargo login% 
录 。 注 意 ， 为 了 个 人 安全 ， 不 要 对 外 公开 此 Token。 

接 下 来 束 可 以 页 接 在 包 的 根 目录 下 使 用 cargo publish 命令 ， 访 命令 
会 自动 将 其 编译 打包 上 传 到 crates.io 平 台 。 也 可 以 单独 使 用 cargo 
package 命令 先 将 其 打包 ， 然 后 再 发 布 。 打 包 以 后 的 文件 可 以 在 
target/package 目 录 下 找到 。 

如 果 执 行 cargo publish 命 令 报 出 如 下 错误 : 


error: api errors: missing or empty metadata fields: description, license. 
Please see http://doc.crates.io/manifest.html#package-metadata for how to 


upload metadata 
则 说 明 访 包 Cargo.toml 文件 的 [package] 4 FIAGRRD BN sce 
J, Eta description, license}. FJ Wt Ra SEAN AY HE F ARR E 
详细 的 内 容 。 这 些 必要 信息 添加 以 后 ， 束 可 以 正常 发 布 『。 这 样 ， 其 他 
开发 者 就 可 以 通过 cargo install 命令 来 安装 并 使 用 此 包 了 。 


10.4 可 见 性 和 私有 性 


在 Rust 中 代码 以 包 、 模 块 、 结 构 体 和 Enum 等 复合 类 型 、 函 数 等 分 
成 不 同 层 次 结构 的 项 “(Item〉。 这 些 项 默认 是 私有 的 ， 但 是 可 以 通过 
pub 关 键 字 来 改变 它们 的 可 见 性 。 通 过 这 样 的 设 定 ， 开 发 者 可 以 在 创建 
对 外 公共 接口 的 同时 隐藏 内 部 的 实现 细节 。 

代码 清单 10-64 展 示 了 Rust 2015 模 块 的 可 见 性 。 

代码 清单 10-64: Rust 2015 模 块 可 见 性 展示 


on DO FSW NY FF 


pub mod outer mod { 
pub(self) fn outer mod fn() {} 
pub mod inner mod { 
// 对 外 层 模块 “outer mod` FM 
pub(in outer mod) fn outer mod visible fn() 
// 对 整个 crate 可 见 
pub(crate) fn crate visible fn() {} 
// 在 `outer mod* 内 部 可 见 
pub(super) fn super mod visible fn() { 
// 访问 同一 个 模块 的 函数 
inner mod visible fn(); 
// 访问 父 模块 的 函数 需要 使 用 ": :" 前 级 
‘ :Outer mod::outer mod fn(); 
} 
// 仅 在 `inner mod .内 部 可 见 
pub (self) fn inner mod visible fn() {} 
} 
pub fn foo() { 
inner mod::outer mod visible fn(); 
inner mod::crate visible fn(); 
inner mod::super mod visible fn(); 
// 不 能 使 用 inner mod 的 私有 函数 


// inner mod::inner mod visible fn(); 


} 
fn bar() { 
// 该 函数 对 整个 crate TU 
outer mod::inner mod::crate visible fn(); 
// 该 函数 只 对 outer mod TIL 
// outer mod::inner mod::super mod visible fn(); 
// 该 函数 只 对 outer mod TI 
// outer mod: :inner mod::outer mod visible fn(); 


// 通过 foo 部 数 调用 内 部 细节 


{ } 


34. Suter modi: foG() ; 
Se J 
36. fn main() { bar() | 


TEAS 10-647, RIRA WIEREEK 4) Se outer_mod#,F 
inner_ mod， 侧 outer_mod 义 被 包含 于 默认 的 顶级 模块 中 ， 也 就 是 当前 
crate 汇 围 。 

代码 第 2 行 ， 使 用 pub (self) ”关键 字 标 注 outer_mod_fn 函 数 的 可 见 
性 ， 只 限于 self ”的 疙 围 。 也 就 是 说 ， 在 outer_mod 和 inner_mod 内 部 都 可 
见 ， 但 是 对 顶级 模块 不 可 见 。 

代码 第 5 行 ， 使 用 pub Cin outer mod ) 关键 字 标 注 
outer_ mod _ visible 和 函数 的 可 见 性 ， 只 限于 outer mod 泄 围 。 也 束 是 说 ， 
IZ RARER X Finer mod 内部， 但 是 可 以 在 outer_ mod 中 访问 。 但 不 
能 在 顶级 模块 中 访问 。 

代码 第 7 行 ， 使 用 pub (crate) 关键 字 标 注 crate_visible_fn 浮 数 的 可 
见 性 ， 代 表 访 图 数 对 整个 crate 范 围 可 见 。 

代码 第 9 行 ， 使 用 pub (super) “关键 字 标 注 super_mod_visible_ 包 函 
数 的 可 见 性 ， 代 表 诅 函数 只 在 outer_mod 内 部 可 见 ， 和 pub Cin 
outer mod) BRUT. super 关键 字 表 示 当 前 模块 的 父 模块 。 

AS21377, Esuper_mod_visible_fnek žk Va] H outer _mod F Œ X 
HJouter_mod_fn At, AEH : ”前 级 ， 代 表 从 根 模 块 开 始 寻 找 相 
应 的 模块 路 径 。 所 以 ,，“:; : outer mod ”就 表示 从 顶级 模块 开始 查找 
outer_mod 模 块 ， 然 后 在 此 模块 中 查找 outer_mod_fn 函 数 。 这 种 路 竹 写 法 
在 Rust 中 叫 作 统一 路 径 (Uniform Path) 

代码 第 16 行 ， 使 用 pub (self) 在 inner_ mod F% X. J 
inner_mod_visible_fn žr, KRIZ A ŽUX fEinner_modW #6 A JL. 

代码 第 18 一 24 行 ， 使 用 pub KEFEN Sfoork a, HA ŠRI aid 
用 了 在 inner_mod 中 定义 的 那 四 个 函数 。 但 是 在 调用 inner_mod_visible_fn 
函数 时 会 出 错 ， 因 为 它 仅 对 inner mod 可见。 通过 pub 关 键 字 ， 可 以 将 foo 
国 数 对 外 开放 给 项 层 模块 去 调用 。 这 样 束 实现 了 对 外 公共 统一 接口 ， 而 
封 狼 了 内 部 的 实现 细节 。 

代 但 第 26 一 35 行 ， 在 顶层 模块 中 定义 了 bar 困 数 。 其 中 调用 了 在 





outer mod 中 定义 的 函数 中 有 对 整个 crate 可 见 的 crate visible fnek 
数 ， 以 及 对 顶层 模块 可 见 的 foo 函 数 ; 而 男 外 两 个 函数 则 无 法 在 外 层 模 
TRA AS Vil FA o 

由 此 可 推出 下 列 结论 : 

: 如 采 不 显示 使 用 pub 声 明 ， 则 函数 或 模块 的 可 见 性 默认 为 私有 的 。 

pub， 可 以 对 外 骏 露 公共 接口 ， 隐 着 内 部 实现 细节 。 

. pub (crate) ， 对 整个 crate 可 见 。 

- pub Cin Path) ， 其 中 Path 是 模块 路 径 ， 表 示 可 以 通过 此 Path 路 径 
来 限定 可 见 苑 围 。 

-pub (self) ， 等 价 于 pub Cin self) ， 表 示 只 限 当 前 模块 可 见 。 

- pub (super) ， 等 价 于 pub Cin super) ， 表 示 在 当前 模块 和 父 模块 
中 可 见 。 

有 了 这 几 种 可 见 性 的 设 定 ， 接 下 来 束 可 以 方便 地 组 织 项 目 代 人 码 了 了。 

然而 ， 在 Rust 2018 中 ， 模 块 系统 有 所 变化 ， 需 要 修改 上 和 面 的 代 
WG, WSs Ht 10-65 所 示 。 

代码 清单 10-65: Rust 2018 模 块 可 见 性 展示 


ii pub mod outer mod { 

2 pub (selfi) in puter mod in() i] 

3 pub mod inner mod { 

4 // Æ Rust 2018 模块 系统 中 必须 使 用 use FA 

uss Crater: outer Modi souter mod In; 

6 // 对 外 层 模 块 “outer mod> TA 

RD 人 TS 
8 // 在 `outer mod? 内 部 可 见 

Dis pub(super) fn super mod visible fn() { 

10. // 访问 同一 个 模块 的 函数 

Lla inner mod visible fn(); 

i, // 因为 使 用 use FAT outer mod， 所 以 这 里 直接 使 用 
L3- outer mod. fn (); 

14. } 

LB // 其 他 代码 同上 

i } 

diel Be pub fin foe) | 

18. // 代码 同上 

Les } 

Ce f 


21. // 其 他 代码 同上 

代码 清单 10-65 展 示 了 Rust ”2018 中 模块 可 见 性 的 相关 变化 。 和 Rust 
2015 相 比 ， 主 要 变化 的 地 方 有 以 下 几 处 : 

` 将 统一 路 径 AEN CAN T EE (Anchored Path) 。 上 所 以 在 代 
人 码 第 5 行 ， 需 要 使 用 use 明 确 地 将 outer mod 模块 引入 inner _ mod 模块 中 。 
不 过 ， 在 不 久 的 将 来 ， 应 该 会 同 统 一 路 任 迁 移 ，。 

代码 第 7 行 ，pub Ćin crate: : outer_mod) 中 的 路 径 需 要 以 crate 
开头。 因为 crate 代 表 当 前 crate， 也 束 是 顶层 檬 块 。 销 定 路 径 是 以 顶层 标 
块 为 根 Croot) KARRERA. 

代码 第 13 行 ， 可 以 直接 使 用 outer_mod 名 函数 ， 因 为 前 面 已 经 使 
用 use 从 父 模 块 中 引入 了 该 函数 。 

DI EWE Rust 2018 中 关于 模块 可 见 性 的 一 些 变 化 。 


另外 ， 需 要 注意 的 是 ， 对 于 trait 中 关联 类 型 和 Enum 中 变 体 的 可 见 
性 ， 会 随 看 trait 和 Enum 的 可 见 性 而 变化 。 但 是 结构 体 中 的 字段 则 不 是 
这 样 的 ， 还 需要 单独 使 用 pub 关键 字 来 改变 其 可 见 性 。 


10.5 小 结 


通过 本 章 的 学 习 ， 我 们 对 Rust 的 模块 化 编程 有 了 较为 全 面 的 了 解 。 
Rust 提 供 了 现代 化 的 包 管 理 系统 ”Cargo， 通 过 它 提供 的 一 系列 命令 ， 开 
发 者 可 以 方便 地 处 理 从 开发 到 发 布 的 整个 流程 。 同 时 Cargo 也 非常 易于 
扩展 ，Rust 社区 中 也 有 一 些 优秀 的 第 三 方 包 管 理 插 件 ， 比 如 cargo-fix、 
rustfmt#lclippy, Æ H EFR A A AB o 

Rust tk RRE EARS FE RAR AMMA DAF mod 8 
字 定 义 檬 块 ， 而 且 单 个 文件 也 是 一 个 默认 的 模块 。 将 时 个 文件 都 聚合 到 
同一 个 文件 灯 下 ， 然 后 通过 mod.rs 文 件 ， 束 可 以 将 它们 组 织 成 一 个 更 大 
的 以 文件 夹 名 称 命 名 的 模块 。 模 块 天 生 是 封闭 的 ， 这 意味 看 其 中 定义 的 
一 切 语 法 元 双 痢 不 是 对 外 公开 的 。 所 以 ， 如 果 想 在 外 部 使 用 某 个 模块 或 
方法 ， 束 需要 使 用 pub 关 键 字 来 修改 其 可 见 性 。 模 块 之 间 的 路 人 径 依 赖 也 
过 循 文件 系统 的 规律 ， 默 认 从 当前 包 的 根 目 录 开 始 人 查找 ， 但 是 可 以 通过 
super 或 self 来 指定 相对 于 当前 模 顽 的 相对 路 径 ，super 表 示 上 一 层 ，self 
表示 当前 模块 ， 这 和 文件 系统 中 的 “..” 和 “.” 操 作 十 分 相似 。 

在 Rust 2018 中 使 用 了 新 的 模块 系统 ， 极 大 地 提高 了 Rust 代 但 模块 化 
的 可 该 性 和 可 维护 性 。 因 此 ， 在 开发 中 要 注意 和 Rust 2015 模 块 系统 的 区 
HI| o 

接 下 来 ， 以 一 道 编程 挑战 赛 的 题目 为 例 ， 基 于 Rust 2018 从 实现 思路 
到 具体 的 代码 实现 都 做 了 详细 的 描述 ， 包 括 模 顽 组织、 代码 复 用 、 第 三 
方 包 的 选择 、Path 和 WO 相关 模块 ， 以 及 增加 单元 测试 、 集 成 测试 和 性 能 
测试 等 。 通 过 从 零 开 始 实现 一 个 功能 完整 的 包 ， 我 们 对 Rust 的 模块 化 编 
程 有 了 更 深入 的 理解 。 

最 后 ， 通 过 简单 的 示例 我 们 了 解 了 Rust 2015 和 Rust 2018 中 模块 可 见 
性 的 差异 ， 主 要 和 模块 系统 相关 。 

本 草 昌 然 润 六 了 Rust 包 演 理 和 模块 的 主要 内 容 ， 但 并 非 所 有 细 市 ， 
书 中 未 讲 到 的 细节 还 需要 读者 目 行 探索 。 





[1 可 以 到 GitHub 上 和 面 查 看 由 作者 翻译 的 TOML 语 言 中 文 规范 (0.4.0 版 ，， 地 址 为 : toml-lang/toml。 
[2] 关于 语义 化 版 本 号 的 详细 说 明 ， 请 参见 : https: //semver.org. 








[3] 在 GitHub 上 面 查找 rust-lang/regex， 可 以 看 到 源码 。 
[4] 可 以 在 https: /doc.rust-lang.org/std/prelude/index.html 中 奋 看 。 
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万 物 并 育 而 不 相 害 ， 道 并 行 而 不 相悖 。 

周末 到 了 ， 你 想 在 线 上 订购 一 王 期 竺 已 久 的 电影 票 ， 选 好 座位 点 击 
确认 后 ， 网 站 却 弹 出 一 个 窗口 ， 提 示 你 所 选择 的 座位 已 经 被 别人 预订 。 
工作 中 ， 你 兴致 勃勃 地 专注 于 功能 开发 时 ， 产 品 经 理 却 过 来 告诉 你 ， 这 
个 需求 需要 修改 。 年 关 将 近 ， 你 想 在 线 上 买 一 张 回 家 的 火车 票 ， 却 发 现 
早已 销售 一 空 。 你 永远 不 知道 下 一 刻 会 发 生 什 么 ， 因 为 现实 世界 是 并 发 
的 。 

计算 机 是 为 人 类 提供 服务 的 ， 也 必须 具备 这 种 并 发 处 理 能 力 。 在 多 
道 程序 系统 还 未 被 支持 的 计算 机 发 展 里 期， 程序 员 就 面临 着 一 种 篮 众 : 
编写 好 的 程序 上 机 运行 必须 要 排队 。 相 比 之 下 ， 现 代 计 算 机 时 代 的 程序 
员 就 幸运 多 了 ， 可 以 在 写 代码 的 同时 听 音 乐 ， 在 听 普 乐 的 同时 使 用 搜索 
引擎 来 查阅 各 种 资料 。 

在 现实 世界 中 ， 电 影 座位 可 以 重新 选择 一 个 ， 火 和 车票 也 可 以 重新 选 
择 另 外 一 天 的 ， 开 发 流程 可 以 重新 修正 ， 并 发 造成 的 结果 是 可 以 承受 
的 。 但 是 在 计算 机 世界 中 ， 并 发 则 可 能 会 造成 恶人 劣 的 影响 。 比 如 ， 提 供 
电影 票 预订 服务 的 手机 App， 多 许 两 个 人 同时 预订 同一 个 场次 的 同一 个 
座位 ， 这 丽 怕 会 引起 纠纷 。 你 可 能 会 想 ， 为 什么 会 出 现 这 种 情况 ? 如 何 
避免 ? 这 正 是 本 章 接 下 来 要 探讨 的 内 容 、 


11.1 通用 概念 


FR (Concurrency) 的 概念 很 容易 和 并 行 (Parallelism) 混 消 ， 事 
实 上 它们 是 不 同 的 概念 。 

谷歌 苦 名 工程 师 罗布 :派克 (Rob Pike) 说 过 ,“ 并 发 就 是 同时 应 对 
(Dealing With) 多 件 事 情 的 能 力 ， 并 行 是 同时 执行 (Doing) 多 件 事 
情 的 能 力 ”。 这 人 句 话 非常 透彻 地 图 述 了 并 发 和 并 行 的 区 别 ， 在 于 “应 
对 ”和 “执行 ”。 

如 果 你 在 吃饭 的 时 候 观 察 一 下 和 餐馆 中 的 菜 个 服务 员 ， 你 会 发 现 他 一 
会 帮 顾 客 点 蛙 ， 一 会 要 闹 余 倒 水 ， 一 会 义 要 收 厂 ， 其 至 有 有 可 能 要 去 厨房 
众 采 ， 这 些 事 情 表 现 起 来 像 是 同时 发 生 的 。 其 实 服务 员 只 是 把 这 些 事情 
切 分 成 一 个 个 小 任务 ， 将 它们 分 配 在 不 同 的 时 间 记 内， 交 着 完成 。 这 整 
是 并 发 ， 关 注 点 在 于 任务 的 切 分 ， 这 是 一 种 逻辑 架构 、 一 种 能 力 。 将 
视角 从 茶 个 固定 的 服务 员 移 到 其 他 不 同 的 服务 员 ， 你 会 友 现 他 们 做 的 事 
情 是 类 似 的 ， 但 他 们 每 一 个 人 部 是 这 些 事 情 执 行 的 个 体 ， 相 互 无 影响 ， 
各 目 独 立 完成 日 己 的 工作 。 这 束 是 并 行 ， 关 注 点 在 于 同时 执行 ， 这 是 
其 体 的 实施 状态 ” 。 并 友 并 不 要 求 一 定 要 并 行 ， 利 用 并 发 可 以 制造 出 并 
行 的 假象 。 

图 11-1 展 示 了 并 友和 和 并行 的 区 列 。 


Concurrency 





图 11-1: 并 发 和 并 行 的 区 别 示意 

在 实际 编程 中 ， 对 任务 进行 分 解 才 古 重点 ， 一 旦 将 任务 分 解 正 确 ， 
到 了 执行 层面 ， 并 行 就 会 目 然 发 生 ， 也 容易 保证 正确 性 。 如 何 分 解 任务 
征 并 有 友 设 计 要 解雇 的 问题 ， 所 以 ， 通 第 更 关注 并 及 而 非 并 行 。 

使 用 并 发 主要 出 于 两 个 主要 原因 : 性 能 和 容错 。 

随 看 多 核 计算 机 的 普及 ， 为 了 利用 其 日 荔 增 长 的 计算 能 力 ， 束 必须 
要 编写 并 发 程序 。 并 戊 编 程 越 来 越 受 重视 ， 甚 全 可 能 成 为 一 种 新 的 编程 
汽 式 ，Go 语 言 的 横 空 出 世 束 证 明了 这 一 点 。 男 外 ， 并 友 编 程 还 可 以 将 
程序 分 为 不 同 的 功能 区 域 ， 让 程 订 更 容 多 理解 和 测试 ， 从 而 减少 程 友 出 
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在 计算 机 中 ， 通 第 使 用 一 些 独立 的 运行 实体 对 并 发 进行 文 持 ， 分 为 
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11.1.1 多 进程 和 多 线程 


进程 是 资源 分 配 的 最 小 单元 ， 线 程 是 程序 执行 时 的 最 小 单元 。 
从 操作 系统 的 角度 来 看 ， 进 程 代 表 操 作 系 统 分 配 的 内 存 、CPU 时 间 


片 守 资 源 的 基本 单位 ， 它 为 程序 提供 基本 的 运行 环境 。 不 同 的 应 用 程序 
可 以 按 业 务 划 分 为 不 同 的 进程 。 从 用 户 的 角度 来 看 ， 进 程 代表 运行 中 的 
应 用 程序 ， 它 是 动态 条 件 下 由 操作 系统 维护 的 资源 管理 实体 ， 而 韭 静态 
的 应 用 程序 文件 。 每 个 进程 部 圣 有 目 己 独立 的 内 存单 元 ， 从 而 极 大 地 所 
高 了 程序 的 运行 效率 。 

可 以 使 用 多 进程 来 提供 并 有 发， 比如 Master-Worker txt, HH Master 
进程 来 管理 Worker 子 进程 ，Worker 子 进程 执行 任务 。Master 和 Worker 之 
间 通 党 使 用 Socket 来 进行 进程 间 通 信 (IPC，〉。 这 样 的 好 处 就 是 具有 极 
高 的 健壮 性 ， 当 茶 个 Worker 子 进程 出 现 问题 时 ， 不 会 影响 到 其 他 子 进 
程 。 但 缺点 也 非常 明显 ， 其 中 最 让 人 诉 病 的 是 进程 会 占用 相当 可 观 的 系 
统 资 源 。 除 此 之 外 ， 进 程 还 有 切换 复杂 、CPU 利 用 率 低 、 创 建 和 销毁 复 
杂 等 缺点 。 

为 了 寻求 比 进程 更 小 的 资源 占用 ， 线 程 应 运 而 生 。 线 程 是 进程 内 的 
实体 ， 它 无 法 独立 存在 ， 必 须 依 徘 进程 ， 线 程 的 系统 资源 都 来源 于 进 
程 ， 包 括 内 存 。 每 个 进程 至 少 拥 有 一 个 线程 ， 这 个 线程 束 是 主线 程 。 每 
个 进程 也 可 以 生成 奢 干 个 线程 来 并 发 执行 多 任务 ， 但 只 能 有 一 个 主线 
程 ， 线 程 和 线程 之 间 可 以 共享 同一 个 进程 内 的 资源 。 一 个 线程 也 可 以 创 
建 或 销毁 另 一 个 线程 ， 所 以 线程 会 有 创建 、 束 绪 、 运 行 、 阻 融和 死亡 五 
种 状态 。 每 个 线程 也 有 目 己 独 圣 的 资源 ， 比 如 线程 栈 。 线 程 和 进程 一 
样 ， 都 受 操 作 系 统 内 核 的 调度 。 线 程 拥 有 进程 难以 企及 的 优点 ， 比 如 二 
用 内 存 少 ， 切 换 徐 单 ，CPU 利 用 率 高 ， 创 建 /销毁 简单 、 快 速 等 。 线 程 
的 缺点 也 是 非常 明显 的 ， 比 如 编程 相当 复杂 ， 调 斌 困难 等 。 正 是 由 于 这 
些 僻 点， 导致 多 线程 并 发 编程 成 为 众多 开发 者 心中 的 痛 。 


11.1.2 事件 驱动 、 措 步 回 调和 协 程 


多 线程 虽然 比 多 进程 更 省 资源 ， 但 其 依然 存在 昂贵 的 系统 内 核 调度 
代价 。 互 联网 的 发 展 让 这 个 问题 更 加 突出 。 在 服务 右 领 域 有 一 个 非常 出 
名 的 C10K ”问题 ， 主 要 是 指 单 台 服 务 问 要 同时 处 理 10K 量 级 的 并 友 连 
接 ， 人 解决 此 问题 最 直接 的 就 是 多 进程 线程》 并发， 每 个 进程 (线程 ) 
处 理 一 个 连接 。 但 是 ， 这 种 处 理 方式 显然 是 有 问题 的 ， 因 为 服务 器 根本 
没有 这 么 多 资源 可 以 分 配给 如 此 多 的 进程 〈 线 程 ) 。 

为 了 解决 C10K 问 题 ， 事 件 驱 动 编程 应 运 而 生 ， 最 知名 的 束 是 Linux 


推出 的 epoll 技术。 事件 驱动 也 可 以 称 为 事件 轮 询 ， 它 的 优点 在 于 编程 
更 加 容 吻 ， 不 用 做 并 用 设计 的 考 碟 ， 不 需要 引入 饥 ， 不 需要 考虑 内 部 调 
上 度 ， 只 需要 依赖 于 事件 ， 最 重要 的 是 不 会 阻 畦 。 所 以 它 可 以 很 方便 地 和 
编程 语言 相 集成 ， 比 如 Node.js， 也 就 是 第 一 个 事件 驱动 编程 模型 语 
言 。 在 ”Node.js 中 ， 仪 仅 使 用 单线 程 束 可 以 拥有 强大 的 并 发 处 理 能 力 ， 
其 力量 来 源 就 是 事件 驱动 和 异步 回调 (Callback) 。 通 过 内 置 的 事件 
循环 机 制 ， 不 断 地 从 事件 队列 中 查询 是 否 有 事件 发 生 ， 当 读 取 到 事件 
时 ， 残 会 调用 和 此 事件 关联 的 回调 函数 ， 整 个 过 程 是 非 阻 堵 的 。 

事件 驱动 和 回调 函数 虽然 解决 了 C10K 的 问题 ， 但 是 对 于 开发 者 来 
说 还 远 远 没有 那么 完美 。 问 题 就 出 在 回调 函数 上 面 ， 如 果 编 写 业 务 比较 
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为 了 避免 “回调 地 狱 ”， 不 俘 地 有 新 方案 航 所 出， 比如 Promise 和 
Future ， 这 两 种 方案 从 不 同 的 角度 来 处 理 回 调 函 数 。Promise 站 在 任务 
处 理 者 的 角度 ， 将 异步 任务 完成 或 失败 的 状态 标记 到 Promise WARE. 
Future 则 站 在 任务 调用 者 的 角度 ， 来 检测 任务 是 个 完成 ， 如 果 完 成 则 直 
接 获 取 结 果 ， 如 末 未 完成 则 阳 考 二 到 获取 到 结果 ， 或 者 编写 回调 函数 避 
免 阻 夸 ， 根 据 相 应 的 完成 状态 执行 此 回调 图 数 。 虽 然 Promise 和 Future 可 
以 进一步 缓解 回调 函数 的 问题 ， 但 它们 还 是 不 够 完美 ， 代 人 码 中 依然 充斥 
看 各 种 几 余 。 

为 了 进一步 完善 基于 事件 驱动 的 编程 体验 ， 一 种 叫 作 协 程 ”的 解决 
方案 浮 出 水 面 。 协 程 的 概念 很 古老 ， 甚 至 可 以 退 溯 到 20 世 纪 60 年 代 的 
COBOL 语 言 ， 但 是 因为 时 代 使 然 ， 协 程 并 未 成 为 像 线程 那样 的 通用 编 
程 元 系 。 然 而 ， 随 看 事件 编程 的 兴起 ， 协 程 勾 有 了 用 武之 地 。 

协 程 为 协同 任务 提供 了 一 种 抽象 ， 这 种 抽象 本 质 上 残 是 控制 流 的 出 
让 和 恢复 。 协 程 的 这 种 机 制 ， 正 好 符合 现实 世界 中 人 类 异步 处 理事 务 的 
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加 产品 经 理 组 织 的 会 议 ， 当 会 议 结束 后 ， 再 切换 回 之 前 的 场景 继续 编 与 
代码 。 昌 然 处 理 了 不 同 的 事件 ， 但 对 于 程序 员 来 说 ， 都 是 顺序 执行 的 。 
可 以 看 出 ， 协 程 和 事件 张 动 属于 绝 配 。 当 事件 来 临时 ， 出 让 当前 的 控制 
权 ， 切 换 场 景 ， 完 成 该 事件 ， 然 后 册 切 换 回 之 前 的 场景 ， 恢 复 之 前 的 工 


作 。 如 采 说 事件 驱动 编程 和 异步 回调 是 站 在 事件 发 生 的 角度 进行 编程 

的 ， 那 么 协 程 束 古 站 在 开 友 者 的 角度 来 进行 编程 的 。 开 发 者 将 目 里 代入 
各 种 事件 中 ， 看 上 去 就是 顺序 执行 的 。 总 的 来 说 ， 协 程 可 以 让 开 友 者 用 
Bla WF) 代码 的 方式 编写 可 异步 执行 的 代码 。 

在 现代 编程 语言 中 ， 实 现 协 程 的 方法 有 很 多 ， 但 其 中 的 区 别 只 在 于 
征 合 有 适合 的 应 用 场景 。 第 见 的 有 Go 语言 的 go 程 〈goroutines ) 
Erlang 语 言 的 轻 量 级 进程 (LWP) 。 另 外 ， 像 Python、Ruby、 
JavaScript 这 样 的 主流 编程 语言 也 实现 了 协 程 ， 当 然 Rust 语 言 也 文 持 协 
程 。 协 程 是 以 线程 为 容 右 的 ， 协 程 的 特点 是 内 存 占 用 比 线 程 更 小 、 上 下 
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用 。 但 协 程 也 不 是 “ 银 弹 >”， 它 虽然 充分 挖掘 了 单线 程 的 利用 鞭 ， 在 单线 
程 下 可 以 处 理 高 并 发 WO， 但 却 无 法 利用 多 核 。 


图 11-2 展 示 了 进程 、 线 程 和 协 程 之 间 的 关系。 





图 11-2， 进程 、 线 程 和 协 程 之 间 的 关系 示意 图 
当然 ， 可 以 将 协 程 和 多 线程 配合 使 用 ， 来 充分 利用 多 核 。 但 是 ， 从 
单线 程 迁 移 到 多 线程 并 不 会 只 珊 来 好 处 ， 它 也 会 市 来 更 多 的 风险 。 
11.1.3 线程 安全 
线程 其 实 是 对 展 层 人 硬件 运行 过 程 的 直接 抽象 ， 这 种 抽象 方式 既 有 优 
点 又 有 缺点 。 优 点 “在 于 很 多 编程 语言 都 对 其 提供 了 文 持 ， 并 且 没 有 对 


其 使 用 方式 加 以 限制 ， 开 及 者 可 以 目 由 地 实现 多 线程 并 及 程序 ， 序 分 利 
用 多 核 。 缺 点 ”包含 两 个 方面 : 一 方面 ， 线 程 的 调度 完全 由 系统 内 核 来 


控制 出 ”， 完 全 随机 ， 这 就 导致 多 个 线程 的 运行 顺序 是 完全 无 法 预测 
的 ， 有 可 能 产生 奇怪 的 结果 ; 另 一 方面 ， 编 写 正确 的 多 线程 并 发 程序 对 
开发 者 的 要 求 太 高 ， 对 多 线程 编程 没有 充足 知识 储备 的 开发 者 很 容易 写 
出 满 是 Bug 的 多 线程 代码 ， 并 且 还 很 难 重 现 和 调试 。 

多 线程 存在 问题 主要 是 因为 资源 共享 ， 比 如 共享 内 存 、 文 件 、 数 据 
等 。 实 际 上 ， 只 有 当 一 个 或 多 个 线程 对 这 些 资源 进行 写 操作 时 才 会 出 
现 问题 ， 如 果 只 读 不 写 ， 资 源 不 会 发 生变 化 ， 自 然 也 不 会 存在 安全 问 
题 。 假 如 一 个 方法 、 数 据 结构 或 库 在 多 线程 环境 中 不 会 出 现任 何 问题 ， 
则 可 以 称 之 为 线程 安全 ”。 所 以 ， 多 线程 编程 的 重点 就 是 如 何 写 出 线程 
安全 的 代码 。 

竞 态 条 件 与 临界 区 

要 想 写 出 线程 安全 的 代码 ， 必 须 先 了 解 安全 的 边界 在 哪里 。 代 码 清 
单 11-1 展 示 了 一 个 线程 不 安全 的 函数 示例 。 

代码 清单 11-1: 线程 不 安全 的 函数 示例 


Le BStEBELEG MUE VE 132 = OF 


44 En unsate seqy) => L321 
cP unsafe f{ 

4. V += 1 

sP V 

Os } 

ts a 
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认 不 允许 修改 静态 变量 的 什 ， 所 以 需要 在 unsafe 块 中 进行 操作 。 

在 单线 程 环境 中 ，unsafe_seq 函数 不 会 有 任何 问题 ， 但 是 将 其 放 到 
多 线程 环境 中 ， 则 会 有 问题 。 问 题 主 要 出 在 代码 第 4 行 的 “V+=1” 操 作 
上 上。 实际 上 ， 访 操作 在 运行 过 程 中 并 非 捍 个 指令 ， 而 是 可 以 分 为 三 步 : 

(1) 从 内 存 中 将 V 的 初始 值 放 入 否 存 器 中 。 

(2) 将 寄存 硕 中 V 的 值 加 1。 

(3) 将 加 1 后 的 值 与 入 内 存 。 

这 三 步 操作 无 法 你 证 在 同一 个 线程 中 被 一 次 执行 完成 。 因 为 系统 内 


核 调 度 的 存在 ， 很 有 可 能 在 线程 A 执 行 第 2 步 操 作 之 后 ， 从 线程 A 切 换 到 
了 线程 B， 而 线程 B 此 时 并 不 知道 线程 A 已 经 执行 了 第 1 步 操 作 ， 它 叉 重 
复 将 V 的 初始 值 放 入 寄存 器 中 ， 当 又 切换 回 线程 A 后 ， 线 程 A 会 继续 执行 
第 3 步 操 作 ， 此 时 束 从 寄存 右 中 读 取 了 错误 的 值 。 

“V+=1” 操 作 的 整个 过 程 如 图 11-3 所 示 。 


V+=1 


、 .将 内 存 中 V 的 初始 值 放 入 寄存 器 中 
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if ene: 


将 加 1 后 的 值 写 入 内 存 





图 11-3: “V+=1” 操 作 的 整个 过 程 

代码 清单 11-1 展 示 了 一 种 常见 的 并 发 安全 问题 ， 叫 作 苋 态 条 件 
(Race Condition) 。 当 东 个 计算 的 正确 性 取 诀 于 多 个 线程 交 符 执行 的 
顺序 时 ， 束 会 产生 苋 态 条 件 。 也 束 是 说 ， 想 计算 出 正确 的 结果 ， 全 菲 运 
气 。 最 常见 的 苋 态 条 件 类 型 是 “证 取 - 修 改 - 写 入 ”和 “ 先 检查 后 执行 OBR 
作 。 代 人 码 清 单 11-1 展 示 的 就 是 “ 读 取 -修改 - 写 入 ” 苋 态 条 件 ， 而 “ 先 检 查 后 
执行 * 苋 态 条 件 则 出 现在 需要 判断 菏 个 条 件 为 真 之 后 才 采 取 相 应 的 动作 
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写 一 个 变量 而 另 一 个 线程 谈 这 个 变量 时 ， 如 有 果 这 两 个 线程 没有 进行 同 
步 ， 则 会 发 生 数 据 范 争 。 因 为 范 态 条 件 的 存在 ， 读 控 a 作 很 可 能 在 写 操 作 
之 有 前 就 完成 了 ， 那 么 读 到 的 数据 就 是 错误 的 。 并 非 所 有 的 苋 态 条 件 都 
是 数据 苋 争 ， 也 并 非 所 有 的 数据 苋 争 都 是 苋 态 条 件 。 


答 单 来 说 ， 当 有 多 个 线程 对 同一 个 变量 同时 进行 谈 写 操作 ， 且 有 至少 
有 一 个 线程 对 该 变量 进行 写 操 作 时 ， 则 会 发 生 数 据 范 争 。 也 就 古 谨 ， 如 
果 所 有 的 线程 都 是 进行 读 控 作 ， 则 不 会 发 生 数 据 苋 争 。 数 据 苋 搜 的 后 来 
会 造成 该 变量 的 值 不 可 知 ， 多 线程 程序 的 运行 结果 将 完全 不 可 了 预测， 其 
至 直接 朋 演 。 

而 葛 态 条 件 是 指 代 但 党 多 线程 乱 序 执行 的 影响 ， 运 行 结果 产生 预料 
之 外 的 变化 。 比 如 对 于 同一 段 程序 ， 多 次 运行 会 产生 不 同 的 结果 ， 完 全 
无 法 预测 ， 它 由 输入 的 数据 和 多 线程 执行 的 顺序 决定 。 

现在 用 一 个 银行 转账 的 示例 来 具体 说 明了 芜 态 条 件 和 数据 苋 争 的 区 
别 。 代 人 码 清 单 11-2 展 示 的 伪 代 码 为 用 于 转账 操作 的 函数 trans1。 

代码 清单 11-2: 用 于 转账 操作 的 函数 


l. transl(amount, account from, account to) 1 

2 if (account from.balance < amount) return FALSE; 
Sn account to.balance += amount; 

4 account. [rom.balance -= amount; 

s return TRUE 

6 } 


在 多 线程 环境 中 ， 这 个 伪 代 公示 例 既 包含 了 苋 态 条 件 ， 义 包 售 了 数 
所 竞争 ， 转 账 结果 将 不 可 预测 。 为 了 解决 该 问题 ， 采 用 条 种 同步 操作 ， 
比如 使 用 互 矿 量 (Mutex) 或 条 种 至 用 中 断 操 作 的 事务 ， 将 包含 数据 苋 
和 搜 的 操作 变 为 原子 性 操作 ， 如 代 人 码 痛 告 11-3 所 示 。 

代码 清单 11-3: 改进 转账 操作 的 函数 


1. trans2(amount, account from, account to) { 


fa atomic { bal = account from.balance; j 

Fa if (bal < amount) return FALSE; 

4. atomic { account to.balance += amount; } 
aa atomic { account from.balance -= amount; } 
Ss return TRUE; 

Ta } 


在 代码 清单 11-3 中 使 用 的 atomic 块 ， 表 示 将 其 范围 内 的 操作 变 为 
原子 性 的 菏 种 手段 。 总 之 ， 现 在 数据 竞争 极 消 除了 。 但 还 存在 禹 态 条 
件 ， 不 同 的 线程 依然 可 以 乱 序 执行 代码 第 ”4 行 和 第 5 行 的 拧 作 。 整 个 区 


图 数 trans2 的 正确 性 ， 在 不 同 的 线程 执行 顺序 之 下 ， 会 出 现 不 同 的 结 
。 上 所 以 还 需要 继续 对 其 改进 ， 如 代码 清单 11-4 所 示 。 
代 但 请 单 11-4: 继续 改进 转账 操作 的 函数 


trans3(amount, account from, account to) { 


+H Na 


atomic { 
1f (account from.balance < amount) return FALSE; 
account to.balance += amount; 
account from.balance == amount; 
return TRUE; 
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} 
在 trans3 肖 数 中 ， 通 过 atomic 块 将 整个 函数 的 执行 过 程 赋予 原子 性 ， 
这 样 就 完全 消除 了 数据 苋 争 和 苋 态 条 件 。 可 以 看 出 ， 消 除 苋 态 条 件 有 的 天 
键 在 于 判断 出 正确 的 临界 区 。 
还 可 以 对 其 进一步 改进 ， 创 建 一 个 有 数据 苋 搜 但 无 鞠 态 条 件 的 函 
数 ， 如 代码 清单 11-5 所 示 。 
代码 清单 11-5: 进一步 改进 转账 操作 的 函数 


Le Chane? (amount, account Drom, account, To) { 

2 account. from.actaivity = true; 

3 account to -activity = true; 

4 atomic { 

ins if (account from.balance < amount) return FALSE; 
6 account to.balance += amount, 

7 account Trom.balance == amount; 

8 return TRUE; 

9 } 
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两 行 代码 表示 这 两 个 账 亏 上 会 出 现 东 些 状态 变更 的 行为 。 这 两 行 代码 会 
出 现 数据 竞争 ， 但 不 存在 竞 态 条 件 。 但 这 里 的 数据 竞争 并 不 会 影响 到 交 
多 行为 的 正确 性 ， 所 以 是 无 害 的 。 
通过 上 面 的 四 上 段 伪 人 代码， 刻意 区 分 了 数据 苋 搜 和 苋 态 条 件 之 间 的 区 


别 。 在 多 线程 编程 中 ， 数 据 苋 争 是 最 单 见 、 最 严 曾 、 最 难 调 试 的 并 友 问 
可 能 会 引起 般 沉 或 内 存 不 安全 。 

fe PRGA Rust 多 线程 代 人 码 实际 产生 苋 态 条 件 和 数据 苋 争 问题 的 
例子 。 代 码 清单 。” 11-6 展 示 了 在 多 线程 环境 中 使 用 unsafe_seq 函 数 的 情 


题 乙 一 ， 


形 。 


iS is 11-6: 在 多 线程 环境 中 使 用 unsafe_seq 函 效 
use std::thread; 

static mut. Vs 232 = Ug 

fn unsafe seq() => 132 { 


} 


} 


unsafe { 
V += 1; 
V 


fr. Maindi 4 


let child = thread: :spawn (move || { 
ror Afi Usda i 
Unsafe seq(); 
Unégate Print Ad CELL g {pr Vir} 
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unsate seq); 

unsatet printla! (main : {]",; Vlg} 
} 
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在 代码 清单 11-6 中 ， 使 用 std: : thread 模 块 中 提供 的 spawn 方 法 在 
main 主 线程 中 生成 子 线 程 child， 并 在 其 中 循环 使 用 unsafe_seq 哨 数 ， 如 
代码 第 10 一 15 行 所 示 。 同 样 ， 在 main 主 线程 中 也 循环 使 用 unsafe_seq 函 
数 ， 如 代 但 第 16 一 19 行 所 示 。 节 后 在 代 但 第 20 行 ， 调 用 child 子 线程 的 
join 方法 ， 让 主线 程 等 待 子 线程 执行 完 再 退出 。 

在 正常 情况 下 ， 对 该 段 代 人 码 进 行 编译 执行 ， 期 每 的 输出 结果 是 main 


主线 程 和 child 子 线程 一 共 输 出 从 0 到 20 的 数字 。 但 实际 执行 多 次 会 看 
到 不 同 的 输出 结果 ， 基 本 会 出 现 以 下 两 种 情况 : 

在 main 主 线程 输出 的 结果 中 会 更名 其 妙 地 少 一 位 ， 并 不 是 从 0 到 10 
的 连续 值 。 

- child 子 线程 输出 的 结果 和 main 主 线程 输出 的 结果 有 重复 。 

可 以 看 出 ， 该 段 代码 在 多 线程 环境 中 的 行为 和 结果 完全 无 法 预测 ， 
完全 无 法 保证 正确 性 。 

同步 、 互 斥 和 原子 类 型 

综 上 所 述 ， 产 生 苋 态 条 件 主 要 是 因为 线程 乱 序 执行， 发 生 数 据 苋 争 
主要 是 因为 多 线程 同时 对 同一 块 内 存 进 行 读 写 。 那 么 ， 要 消除 苋 态 条 
件 ， 只 需要 保证 线程 按 指 定 顺 序 来 访问 即 可 。 要 避免 数据 竞争 ， 只 需要 
保证 相关 数据 结构 操作 的 原子 性 即 可 。 所 以 ， 很 多 编程 语言 都 通过 提供 
le) AP ALT SETA BR SEAS ARTE, EH BR AER SR A oe SH ots $F o 
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人 允许 单个 线程 对 临界 资源 进行 访问 ， 对 其 他 线程 具有 排他 性 ， 线 程 之 间 
的 关系 表现 为 互 斥 。 而 原 了 于 类 型 是 指 修改 临 界 数据 结构 的 内 部 实现 ， 确 
傈 对 它们 做 任何 更 新 ， 在 外 界 看 来 都 是 原子 性 的 ， 不 可 中 新 。 

通常 可 以 使 用 锁 、 信 号 量 (Semaphores) 、 屏 障 (Barrier) 和 
条 件 变量 (Condition Variable) 机 制 来 实现 线程 同步 。 根 据 不 同 的 并 
KIARA AIRE ARAN, AAR CMutex) 、 读 写 锁 
(RwLock) M Á jeti (Spinlock) 等 。 锁 的 作用 是 可 以 保护 临界 区 ， 同 
时 达到 同步 和 互 斥 的 效果 。 不 同 的 锁 表 现 不 同 ， 比 如 互 斥 锁 ， 每 次 只 多 
许 单 个 线程 访问 临界 资产; 谈 与 锁 可 以 同时 文 持 多 个 线程 谈 或 单个 线程 
5B; 目 旋 饥 和 互 斥 锁 关 似 ， 但 当 获 取 锁 失败 时 ， 它 不 会 让 线程 睡眠 ， 而 
Fe ir Hee We) EL PSR A KED] o 

age ”可 以 在 线程 间 传 递 信 号 ， 也 叫 作 人 信号灯， 它 可 以 为 资源 访 
问 进 行 计 数 。 信 和 号 量 是 一 个 非 负 整数 ， 所 有 通过 它 的 线程 都 会 将 该 整数 
减 1， 如 果 信 号 量 为 0， 那 么 其 他 线程 只 能 等 待 。 当 线程 执行 完毕 离开 
临界 区 时 ， 信 号 量 会 再 次 加 1。 妆 信号 量 只 允许 设置 0O 和 1 时 ， 效 果 相 当 
+ Aa. 
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上 上 ， 是 通过 锁 来 你 护 指 定 区 域 的 原子 性 的 。 有 些 语言 也 提供 了 原子 类 型 
来 保证 原子 性 ， 比 如 Java、C++ 以 及 Rust。 上 其 有 原子 性 的 操作 一 定 是 不 
可 分 割 的 ， 要 么 全 部 完成 ， 要 么 什么 部 不 做 。 原 子 类 型 使 用 起 来 简单 ， 
但 其 否 后 的 机 制 却 一 点 也 不 人 简单， 了 解 其 硝 后 的 机 制 有 助 于 更 好 地 使 用 
RFRA 

原子 类 型 与 多 线程 内 存 模型 

在 计算 机 中 程序 需要 经 过 CPU、CPU 多 级 缓存 和 内 存 等 协同 工作 才 
能 顺利 执行 ， 在 这 种 体系 结构 之 下 ， 如 果 是 多 核 系 统 ， 其 中 一 个 CPU 核 
心 修改 了 了 变量， 那么 如 何 退 知 其 他 核心 是 一 个 重要 的 问题 。 并 且 为 了 近 
局 性 能 ， 现 代 处 理 帝 和 编程 语言 的 编译 此 部 对 程序 进行 了 极度 优化 ， 比 
如 乱 序 执行 和 指令 重 排 ， 所 以 机 右 并 非 按照 实际 编写 的 那样 来 执行 ， 
如 图 11-4 所 示 。 在 多 线程 编程 中 ， 只 有 你 持 顺 序 一 任性 ， 才 能 你 证 程序 
的 正确 性 。 所 谓 顺 序 一 至 性 ， 主 要 是 约定 了 两 件 事 : 


Optimization 





图 11-4: 代码 经 过 层 层 优化 
.在 单线 程 内 部 指令 都 是 按 程序 确定 的 顺序 来 执行 的 。 
， 多 线程 程序 在 执行 过 程 中 虽然 是 交 蔡 执行 的 ， 但 从 全 局 来 看 ， 也 
是 按 某 种 确定 的 顺序 来 执行 的 。 
显然 ， 在 硬件 层面 并 没有 支持 顺序 一 致 性 ， 所 以 需要 编程 语言 和 计 


算 机 系统 〈 包 括 编译 需 、CPU 等 ) ZAAK SAN”, BRAM [AR 
程 访问 同一 个 内 存 位 置 时 的 语义 ， 以 及 霖 个 线程 对 内 存 位 置 的 更 新 何 时 
才能 被 其 他 线程 看 到。 这 个 契约 就是 多 线程 内 存 模型 ”。 通 过 该 内 和 存 模 
型 ， 程 序 员 束 可 以 使 用 编程 语言 提供 的 同步 原 语 ( 比 如 C++ 和 Rust 提 供 
的 Atomic 类 型 ) 来 保证 多 线程 下 的 顺序 一 致 性 ， 这 也 是 无 锁 并 发 编程 的 
基础 。 

Rust 的 多 线程 内 存 模 型 来 源 于 C++11， 而 C++11 中 实现 的 Atomic 类 
型 是 通过 store 和 1load 这 两 个 CPU 指令 进行 数据 存 取 【寄存 邦和 内 存 之 
J) 的 ， 并 且 额 外 接收 一 个 内 存 序列 (Memory Order ) 作为 参数 。 
C++11 文 持 6 种 内 存 排 序 约 束 ， 而 Rust 是 基于 LLVM 实 现 的 ， 所 以 Rust 通 
过 LLVM 原 子 内 存 排序 约束 来 实现 不 同 级 别 的 原子 性 。 

为 什么 多 线程 编程 这 么 难 

既然 有 了 这 么 多 避免 范 态 条 件 和 数据 范 争 的 手段 ， 那 么 为 什么 所 到 
多 线程 编程 还 会 让 广大 开发 者 心 生 恐惧 呢 ? 主要 有 以 下 几 点 原因 : 

` 虽然 可 以 使 用 锁 来 同步 ， 但 开发 者 有 可 能 瑟 记 加 锁 。 

: 即使 疫 有 和 环 记 加 锁 ， 也 可 能 出 现 死 锁 的 情况 。 

` 多 线程 程序 难以 调试 ， 如 果 出 现 了 问题 很 难 再 现 。 

忌 有 的 来 说 ， 主 要 因为 开发 者 目 遇 很 难 敬 驭 多 线程 编程 。 即 便 是 技艺 
高 超 的 开发 者 ， 也 难以 保证 写 出 没有 问题 的 多 线程 代码 。 难 以 概 驭 育 后 
的 原因 在 于 ， 开 发 者 总 是 有 意 无 意 地 将 不 该 共享 的 数据 错误 地 共享 ， 将 
其 暴露 在 多 个 线程 可 以 操作 的 危险 区 。Rust 语 言 的 出 现 正 是 要 解决 这 个 
问题 的 。 


11.2 多 线程 并 发 编程 


Rust 为 开发 者 提供 的 并 发 编程 工具 和 其 他 语言 类 似 ， 主 要 包括 如 下 
两 个 方面 : 

:线程 管理 ， 在 std: : thread PARR PEM J SHAKEN A eA aL 
和 一 些 底层 同步 原 语 io 

. 线程 同步 ， 在 std: : sync 模块 中 定义 了 锁 、Channel、 条 件 变 量 
AU GF hie 

11.2.1 线程 管理 


Rust 中 的 线程 是 本 地 线程 ， 每 个 线程 都 有 目 己 的 栈 和 本 地 状态 。 创 
建 一 个 线程 很 便 早 ， 如 代码 清早 11-7 所 示 。 
代码 清单 11-7: 创建 线程 


Tiss use std::thread; 


Za ea Weim) 4 

3 let mut v = vec! []; 

4. ror. wa kts B.S 

A let child = thread: :spawn (move || { 
6. Dnt 
Ta BE 

8, (Ll 

S.. } 

LQ, printin, ("1m main ¢ Join betore "jj 
Lis tor Cilia in yw 4 

ik BRLLO: TOINI} 

las } 

14. printint (“in main ¢ Join after"jy 
LSe d 


ER 1-7-7, VUNE use Astd: : thread 模 块 使 用 线程 创 
建 的 函数 spawn。 代 码 第 3 行 ， 初 始 化 了 一 个 可 变 的 动态 数组 v， 用 于 存 
放生 成 的 子 线程 。 
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组 v 中 。 其 中 代码 第 5~7 行 ， 使 用 spawn 函 数 创建 子 线 程 ， 接 收 一 个 闭 包 
作为 参数 ， 并 且 该 闭 包 种 要 捕获 循环 变 量 id， 上 默认 是 按 引 用 来 捕获 的 。 
但 这 里 涉及 生命 周期 的 问题 ， 传 驯 给 子 线程 的 团 包 有 可 能 存活 周期 长 于 
ZWAZO WRAS H, MA fe Ee, Rust 
绝对 不 允许 的 。 所 以 ， 这 里 使 用 move “关键 字 来 强行 将 捕获 变量 id 的 所 
有 权 转 移 到 闭 包 中 。 

代码 第 11~13 行 ， 对 数组 v 进行 迭代 ， 调 用 其 中 每 一 个 子 线程 的 
join 方法 ， 束 可 以 让 main 主 线程 等 竺 这 些 子 线程 都 执行 完 侍 。 人 代码 第 10 
行 和 第 14 行 ， 分 别 在 子 线程 join 的 前 后 打印 相应 的 信息 . 

可 以 对 该 段 代 码 进行 多 次 编译 执行 ， 代 码 清单 11-8 展 示 了 其 中 菜 次 
执行 的 结果 。 

代码 清单 11-8: 执行 结 

in child; 
Ln, CHLIA? 
i Enida 
Li 2 hs Ot Be 
in main : join before 

in, Chita: 4 

in main : join after 

HEY EE RATAR WA, maint Agee A RIEKE 2 BL 
序 执行 的 , “in main: join before” 的 输出 位 置 并 不 国定 ， 但 是 “in main: 
join after” 的 位 置 是 固定 的 ， 永 远 在 结尾 。 

假如 在 代码 清单 11-7 中 不 使 用 join 方法 ，main 主 线程 并 不 会 等 待 子 
线程 执行 完毕 ， 那 么 编 详 执行 的 结 末 束 会 变 得 更 加 难以 预料 。 首 先 可 以 
HENE. Æ main 主线 程 中 打印 的 两 条 信息 永远 会 输出 ， 但 是 在 子 线 
程 中 打印 的 结果 束 不 一 定 了 。 因 为 乱 友 执行 的 存在 ， 有 时 候 能 看 到 一 个 
子 线程 的 输出 ， 有 时 候 能 看 到 三 个 子 线程 的 输出 ， 央 时 候 完 全 看 不 到 ， 
完全 无 法 预料 ， 因 为 谁 也 无 法 保证 子 线程 一 定 会 比 main 线 程 先 执 行 完 
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所 以 ， 如 果 想 要 多 个 线程 协作 ， 则 通 第 会 使 用 join 方 法 来 指定 一 个 
线程 等 待 其 他 线程 执行 完 之 后 再 执行 它 目 己 的 任务 。 线 程 join 机 制 示意 


图 如 图 11-5 所 示 。 


thread1 { 
thread2.join 


一 一 > thread 


wait thread2 


thread2 





图 11-5: 线程 join 机 制 示意 图 

从 图 11-5 中 可 以 看 出 ， 如 果 在 thread1 中 调用 thread2 的 join 方 法 ， 则 
thread 1 E22 FE Val FA join TAM AS — ZilSfythread2, FHRA H, RA 
thread2 执 行 完 毕 后 才 继 续 执 行 thread1 中 的 任务 。 这 也 就 是 在 代码 清单 
11-8 中 “in main: join after”* 输 出 永远 在 最 后 的 原因 。 

定制 线程 

直接 使 用 thread: : spawn 生 成 的 线程 ， 默 认 设 有 名 称 ， 并 用 其 栈 大 
小 默认 为 2MB。 如 果 想 为 线程 指定 名 称 或 者 修改 默认 栈 大 小 ， 则 可 以 使 
用 thread: : Builder 结构 体 来 创建 可 配置 的 线程 ， 如 代码 清单 11-9 所 


一 和 


外。 
代码 清单 11-9: 使 用 thread: : Builder 来 定制 线程 


1 use std::panic; 

2 use std::thread::{Builder, current}; 

5 fn main() { 

4 let mut v = vec! []; 

A COn ad At Ged 1 

6 let thread name = formati ("child-{]"; Id); 
7 let size: usize = 3 * 1024; 

8 let builder = Builder: :new() 

9 


.name (thread name).stack size(size); 


Ls let child = builder.spawn(move || { 
ibe | 
I2. if id == { 
LB panic::catch unwind(|| 1 
1 panic! ("oh nol")? 
15, iE 
16; printin: ("in {F do Sm", Current (J fame () unwrap ())s 
i he #8 } 
F) .unwrap(); 
19. vy. push (child) ; 
AN } 
ks for child ah v í 
22. Chiid.161n() uUnwEap() ¢ 
23 . } 
24. } 


代码 清单 11-9 是 对 代码 清早 11-7 的 部 分 修改 ， 使 用 thread: : Builder 
来 定制 新 的 线程 。 代 码 第 6 行 和 第 7 行 ， 分 别 声明 了 线程 的 名 称 和 栈 大 
小 。 代 码 第 8 行 和 第 9 行 ， 通 过 Builder: : new 方 法 来 生成 新 的 Builder 实 
例 ， 然 后 分 别 将 事先 声明 好 的 名 称 和 栈 大 小 参数 传 入 name 和 stack_size 
方法 中 ， 束 可 以 生成 指定 名 称 和 栈 大 小 的 线程 。 这 里 值得 注意 的 是 ， 主 
线程 的 大 小 与 Rust 语 言 无 关 ， 这 是 因为 主线 程 的 栈 实际 上 就 是 进程 的 
栈 ， 由 操作 系统 来 决定 。 修 改 所 生成 线程 的 默认 值 也 可 以 通过 指定 环境 
变量 RUST_MIN_STACK 来 完成 ， 但 是 它 的 值 会 窜 Builder: 
stack size7S im fH. 


代码 第 10 行 ， 调 用 builder.spawn 方 法 来 生成 线程 ， 该 spawn 方 法 是 
Builder 实 例 的 方法 ， 与 thread: : spawn žr —łž. SEbR_E, Æ 
thread: : spawn 内 部 也 是 使 用 Builder 来 生成 默认 配置 的 线程 的 。 

代码 第 12 一 17 行 ， 特 意 在 第 三 个 线程 中 使 用 panic! KEN FF 
且 使 用 catch_unwind 来 捕获 臣 慨 。 在 catch_unwind 之 后 ， 再 次 输出 一 些 
特定 信息 。 其 中 代码 第 16 行使 用 了 thread: : current BOR SKA A k 
TE o 

注意 代码 第 18 行 ， 在 spawn 方 法 结尾 处 义 调用 了 unwrap 方 法。 实际 
上 ， 之 前 thread: : spawn 方 法 返回 的 是 JoinHandle<T> 类 型 ， 而 
Builder 的 spawn 方 法 返回 的 是 Result<JoinHandle<T > 之 类型， 所 以 这 
里 需要 加 unwrap 方 法 。JoinHandle<T > 代表 线程 与 其 他 线程 join 的 权 
BRR o 

代码 清单 11-9 执 行 的 结 示 如 代码 请 单 11-10 所 示 。 

代码 清单 11-10: 执行 结果 

thřéad 'G4hiid=3" panicked at "OH nG!", sere7Main.rST14924 
note; Run with “RUST BACKTRACE=1" for a backtrace. 
TH emils 1 


im cenila © 
LA Cres 2 
im child: 4 
iti enile: 3 


if enild-3 dö sm 

从 代码 清单 11-10 中 可 以 看 出 ， 为 线程 指定 的 名 称 可 以 在 线程 发 生 
如 懂 时 显示 出 来 ， 此 处 为 “child-3”。 如 果 不 给 线程 指定 名 称 ， 则 默认 显 
7X“unknow”. VIE i Ha St AB o WHH child-34k REF AN eh bie 
已 经 被 捕获 ， 线 程 得 以 恢复 。 

线程 本 地 存储 

线程 本 地 存储 (Thread Local Storage, TLS) 是 每 个 线程 独 有 的 
存储 空间 ， 在 这 里 可 以 存放 其 他 线程 无 法 访问 的 本 地 数据 ， 如 代码 清单 
11-11 所 示 。 

代码 清 单 11-11: 线程 本 地 存储 示例 


use std::cell::RefCell; 


use std::thread; 


thread local! (static FOO: ReftCell<u3z> = RetCell sinew (1) ); 
FOO.with(|f| { 


1 
2 
3s fh main) d 
d 
5 
6 assert eq! (*t.borrow(), LY 


Ta *f.borrow mut() = 2; 

8. } ) 7 

hs thread::spawn(|| { 

W; FOO. witi 4 

Iia assert eq! (*i.borrow(), 1); 
12 *f.,. borrow mut() = 3; 

ilk } ) 7 

lä; riy 

L3. FOO.with(|f| 4 

L6. = 
L7. ek: 

18. } 


在 代 但 清单 11-11 中 ， 人 代码 第 4 行 ， 使 用 thread_local! 宏 以 一 个 类 
型 为 RefCell<u32> 之 并 且 初 始 值 为 1 的 静态 变量 FOO 作 为 参数 ， 了 最 终 会 生 
成 类 型 为 thread: : LocalKey 的 实例 FOO。 为 了 提供 内 部 可 变性 ， 有 时 
候 thread_local! 宏 会 配合 Cell 和 RefCell 一 起 使 用 。 

thread: : LocalKey 是 一 个 结构 体 ， 它 提供 了 一 个 with 方法 ， 可 以 
通过 给 该 方法 传 入 团 包 来 操作 线程 本 地 存储 中 包含 的 变量 。 如 代码 第 5 
一 8 行 所 示 ， 痛 先 判断 初始 值 是 个 为 1， 然 后 通过 调用 borrow_mnut 方 法 将 
线程 本 地 存储 内 部 的 值 修改 为 2。 

代码 第 9 一 14 行 ， 生 成 了 子 线程 ， 并 且 访 子 线程 也 有 一 个 线程 本 地 
存储 实例 FOO， 初 始 值 为 1。 当 然 ， 也 可 以 通过 thread_local! 安 在 该 子 
线程 中 重新 创建 一 个 LocalKey 实 例 。 但 是 本 例 中 还 是 使 用 来 日 main 主 线 
程 的 FOO 副 本 。 人 代码 第 11 行 和 第 12 行 ， 首 移 验 证 EFOO 初 始 值 ， 然 后 将 它 
的 值 改 为 3。 

代码 第 15~17 行 ， 主 要 用 来 判断 主线 程 中 的 线程 本 地 存储 实例 
FOO 内 部 的 值 有 没有 发 生变 化 。 


通过 编 详 执行 该 段 代 人 码 ， 可 以 得 项，main 主 线程 中 的 线程 本 地 存储 
实例 FOO 内 部 的 值 并 没有 因为 子 线 程 中 的 修改 而 友 生变 化 。 在 标准 库 中 
很 多 数据 结构 实现 都 使 用 了 thread_local! 宏 来 定义 时 个 线程 内 的 一 些 独 
译 数 据 ， 比 如 映射 类 型 HashMap。 

压 层 同步 原 语 

在 std: : thread 模 块 中 还 提供 了 一 些 函 数 ， 用 来 支持 确 层 同步 原 
语 ， 主 要 包括 park/unpark 和 yield_now 函 数 。 

std: : thread: : park 函 数 所 供 了 阻塞 线程 的 基本 能 力 ， 而 std: : 
thread: : Thread: : unpark 函 效 可 以 将 阻 寺 的 线程 重 局 。 可 以 利用 park 
和 unpark 国 数 来 方便 地 创建 一 些 新 的 同步 原 语 ， 比 如 茶 种 锁 。 但 要 注 
意 park 国 数 并 不 能 永久 地 阻力 线程 ， 也 可 以 通过 std: : thread: : 
park_timeout 来 显 式 指定 阻 守 超时 时 间 。 

代码 清单 11-12 展 示 了 park 和 unpark 函 数 的 用 法 。 

代码 清单 11-12: park 和 unpark 了 国 数 使 用 示例 

1. use std::thread; 


2 use stdt: times: Duratsaon; 

Sy Th paint) i 

4. let parked thread = thread: <Bu1lder’s thew) 
hes .Spawn(|| { 

oa printin! ("Parking thread”) ; 

Ta thread: :park(); 

8 printlin! ("Thread unparked") ; 

}) .unwrap(); 

10, Chread?::eleep (Duration: sirom millis (10)); 
ii a printin! ("Unpark the thread"); 

AL parked thread.thread() .unpark (); 

Le i parked thread.join().unwrap() ; 

14. } 


在 代码 清单 11-12 中 引入 J 了 std: : time 模 块 ， 其 中 的 Duration ”类 型 
专门 用 于 表示 系统 超时 ， 默 认 new 方 法 生成 以 纳 秒 (ns) 为 时 间 单 位 的 
实例 ， 但 是 也 提供 了 from_secs 和 from_millis 方 法 分 别 生 成 以 秒 Cs) 和 
ZH Cms) 为 时 间 单 位 的 实例 。 


代码 第 4 一 9 行 ， 通 过 Builder 来 生成 线程 ， 并 在 该 线程 传递 的 财 包 中 
调用 thread: : park 函 数 ， 目 的 在 于 阻 桂 该 线程 。 
代码 第 10 行 ， 使 用 thread: : sleep žin kE 0ms. 4T 
线程 parked_thread 生 成 完毕 ， 目 的 在 于 让 子 线 程 能 先 打 印 出 相 天 的 信 
轧 。 但 值得 注意 的 是 ， 千 万 不 要 使 用 sleep 来 进行 任何 线程 同步 的 操 
作 ， 它 并 不 会 保证 线程 执行 的 顺序 。 
代码 第 12 行 ， 通 过 调用 parked_thread 的 thread 方 法 从 JoinHandle 中 得 
到 具体 的 线程 ， 然 后 调用  unpark ”函数 ， 束 可 以 将 处 于 阻塞 状态 的 
parked _ thread ”线程 重 司 ， 访 线程 会 继续 治 着 之 前 车 停 的 上 下 文 开始 执 
行 。 
代码 清单 11-12 的 执行 结 未 如 代码 清单 11-13 所 示 。 
代码 清单 11-13: 执行 结 
Parking thread 
Unpark the thread 
Thread unparked 


可 以 看 出 ，thread: : sleep ”函数 起 作用 了 ， 首 先 和 输出 的 是 子 线程 
parked_thread “” 阻 杜 前 的 打印 信息 ， 之 后 调用 到 thread: : parkt, 2 
程 承 会 发 生 阻 村 。 接 下 来 轮 到 main 主 线程 开始 执行 ， 打 印 出 “Unpark the 
thread” 之 后 ， 获 取 parked_thread 线 程 并 执行 unpark 方 法 将 其 重启 。 最 后 
通过 join 方法 等 竺 parked_thread 线 程 执行 完毕 ， 输 出 最 终结 果 。 

除了 阻塞 /重启 的 同步 原 语 ，std: : thread 模块 还 提供 了 主动 出 让 当 
前 线程 时 间 厂 的 函数 yield_now。 众 所 周知 ， 操 作 系 统 是 抢占 式 调 度 线 
程 的 ， 每 个 线程 都 有 固定 的 执行 时 间 上 请， 时 间 户 是 由 操作 系统 切 分 好 
的 ， 以 便 每 个 线程 都 可 以 拥有 公平 使 用 CPU 的 机 会 。 但 是 有 时 开发 者 明 
确 知 道 菏 个 线程 在 一 段 时 间 内 会 什么 都 不 做 ， 为 了 和 省 计算 时 间 ， 可 以 
使 用 yield_now 函 数 主 动 放 并 当前 操作 系统 分 配 的 时 间 请 ， 让 给 其 他 线 
程 执 行 。 


11.2.2 Send 和 Sync 


从 Rust 扣 供 的 线程 官 理工 具 来 看 ， 并 没有 友 现 什么 特殊 的 地 方 ， 和 和 
传统 语言 的 线程 管理 方式 非 第 相似。 那么 ，Rust 是 如 何 做 到 之 前 宣称 的 


那样 默认 线程 安全 的 呢 ? 这 要 归功 于 std: : marker: : Send 和 std: : 
marker: : Sync 两 个 特殊 的 内 置 trait。Send 和 Sync 被 定义 于 std:， : 
marker 模 块 中 ， 它 们 属于 标记 trait ， 其 作用 如 下 : 

实现 了 Send 的 类 型 ， 可 以 安全 地 在 线程 间 传 递 所 有 权 OC EWE 
说 ， 可 以 路 线程 移动 。 

”实现 了 Sync 的 类 型 ， 可 以 安全 地 在 线程 间 传 递 不 可 变 借 用 。 也 
驶 是 说 ， 可 以 路 线程 共 宇 。 

这 两 个 标记 trait 有 反映 了 Rust 看 符 线 程 安 全 的 哲学 : 多 线程 共享 内 存 
并 非 线 程 不 安全 问题 所 在 ， 问 题 在 于 错误 地 共享 数据 ” 。 通 过 Send 和 
Sync 将 类 型 贴 上 “标签 ?， 由 编 详 需 来 识别 这 些 关 型 是 人 否 可 以 在 多 个 线程 
之 加 移动 或 共 圣 ， 从 而 做 到 在 编 详 期 束 能 友 现 线程 个 安全 的 问题 。 和 
Send/Sync 相 反 的 标记 是 ! Send/! Sync ， 表 示 不 能 在 线程 间 安 全 传递 的 

我 们 来 观察 std: : thread: : spawn 函 数 的 源码 实现 ， 如 代码 清单 
11-14 所 示 。 

代码 清单 11-14: spawn 函 数 的 源码 实现 
1. pub fn spawn<F, T>(f: F) -> JoinHandle<T> where 
2 F: FnOnce() -> T, F: Send + ‘static, T: Send + ‘static 
Seg { 

4 Builder: :new().spawn(f) .unwrap () 
3 } 

在 代码 清单 11-14 中 ，spawn 函 数 中 的 财 包 上 与 财 包 的 返回 类 型 T 都 被 
加 上 了 Send Fil’ static 限定 。 其 中 Send 限 定 了 闭 包 的 类 型 以 及 闭 包 的 返 
器 值 都 必须 是 实现 了 Send 的 类 型 ， 只 有 实现 了 Send 的 类 型 才 可 以 在 线 
程 间 传 递 。 而 财 包 的 类 型 是 和 捕获 变量 相关 的 ， 如 果 捕 获释 量 的 类 型 实 
Il Y Send, HA WERE F Send. 

m’ static ”限定 表示 类 型 T 只 能 是 非 引 用 类 型 (R&' static? 
Sh) 。 其 实 这 个 很 容易 理解 ， 闭 包 在 线程 间 传 递 ， 如 果 和 直接 携 和 了 引用 
类 型 ， 生 命 周 期 将 无 法 保证 ， 很 容易 出 现 巧 垩 指针 ， 造 成 内 存 不 安全 。 
这 是 Rust 绝 对 不 允许 出 现 的 情况 。 

既然 不 允许 在 线程 间 直 接 传递 引用 ， 那 么 如 何 才 能 在 多 个 线程 之 间 


PSE ee? 如 和 果 是 不 可 变 的 变量 ， 则 可 以 通过 Arc<T> 来 共 
享 。Arc<T> 是 Rc<T> 的 线程 安全 版 本 ， 因 为 在 Rc<T> 内 部 并 未 使 
用 原子 操作 ， 所 以 在 多 个 线程 之 间 共 对 会 出 现 安全 问题 ， 而 在 ”Arc<T 
> 内 部 使 用 了 原子 操作 ， 所 以 默认 线程 安全 。 

代码 清单 11-15 展 示 了 为 Arc<T> 实 现 Send 和 Sync。 

代码 清单 11-15: 为 Arc 二 T 才 实现 Send 和 Sync 
1. unsafe impl<T: ?Sized + Sync + Send> Send for Arc<T> {} 
2. unsafe impl<T: ?Sized + Sync + Send> Sync for Arc<T> {} 


可 以 看 出 ， 只 要 T 是 实现 了 Send 和 Sync 的 类 型 ， 那 么 Arc 二 T 二 也 会 
实现 Send 和 Sync。 值 得 注意 的 是 ，Send 和 Sync 这 两 个 trait 是 unsafe 的 ， 
这 意味 痢 如 末 开 及 者 为 目 定 义 关 型 手动 实现 这 两 个 trait， 编 译 硕 是 不 保 
证 线程 安全 的 。 实 际 上 ， 在 Rust 标 准 库 std: : marker 模 块 内 部 ， 束 为 所 
有 关 型 默认 实现 了 Send 和 Sync， 换 名 话说 ， 束 是 为 所 有 关 型 设 定好 了 
驮 认 的 线程 安全 规则 ， 如 代码 清单 11-16 所 示 。 

代码 清单 11-16: 在 标准 库 内 部 默认 为 所 有 关 型 实现 了 Send 和 Sync 
unsafe impl Send for .. { } 

2 Tm YSized> Send for “const r4 } 

3 impl<T: ?Sized> !Send for *mut T { } 

4 usare impl Syne tor .. t | 

i timo: Psiged> [Syne fer *econst T 4 } 

6 impl<T: Ysizged> ome tor “mat T 4 | 

7 mod impls { 

8 unsarte ifbl<'a, Ti: Syne + 7bized> Send for pi T {} 

9 unsafe impl<'a, T: Send + ?Sized> Send for &'a mut T {} 
LQ J 


在 代码 清单 11-16 中 ， 人 代码 第 1 行 和 第 4 行使 用 了 一 种 特殊 的 语法 ， 
分 别 表示 为 所 有 类 型 实现 了 Send 和 Sync。 这 里 要 注意 Send 和 Sync 本 身 只 
是 标记 trait， 没 有 任何 默认 的 方法 。 如 果 想 使 用 第 1 行 和 第 4 行 这 样 的 语 
法 ， 必 须 满足 两 个 条 件 : 

.impl 和 trait 必 须 在 同一 个 模块 中 。 

` 在 该 trait 内 部 不 能 有 任何 方法 。 


代 人 码 第 2 行 和 第 3 行 以 及 代 人 码 第 5 行 和 第 6 行 ， 分 别 为 *const 工 和 *mnut 
TIT 类 型 实现 了 ! Send 和 ! Sync， 表 示 实 现 这 两 种 trait 的 类 型 不 能 在 线程 
间 安 全 传递 。 

代码 第 7 一 10 行 ， 分 别 为 &' aT 和 &' a mut T 实现 了 Send， 但 是 
对 工 的 限定 不 同 。&”a TI 要 求 T 必 须 是 实现 了 Sync 的 类 型 ， 表 示 只 要 实 
现 了 Sync 的 类 型 ， 其 不 可 变 借 用 就 可 以 安全 地 在 线程 间 共 至 ; 而 & a 
mut 工 要 求 T 必 须 是 实现 了 Send 的 闫 型 ， 表 示 只 要 实现 了 Send 的 类 型 ， 
其 可 变 售 用 残 可 以 安全 地 在 线程 间 移 动 。 

除 在 std: : marker 模 块 中 标记 的 上 述 未 实现 Send 和 Sync 的 类 型 之 
外 ， 在 其 他 模块 中 也 有 。 比 如 Cell 和 RefCell 都 实现 了 ! Sync， 表 示 它 们 
无 法 路 线程 共享 ， 再 比如 Rc 实 现 了 ! Send， 表 示 它 无 法 路 线程 移动 。 

通过 Send 和 Sync 构建 的 规则 ， 编 详 堪 束 可 以 方便 地 识别 线程 安全 问 
题 。 人 代码 清单 11-17 展 示 了 在 线程 间 传 递 可 弯 字 人 符 串 。 

代码 清单 11-17: 在 线程 间 传 递 可 变 字 符 串 


1 use std::thread; 

2 fn main() { 

3 let mun s = “Helle",.ce Stringi); 
4. rey if Yass 4 

5 thread::spawn(move || { 

6 S.push sex(" Rusti”) 3 

7 }); 

8 } 


9. } 
VRS 11-17 EAS AS BI EE PEP EE Bs EB IB FF 
串 。 该 段 代 码 存 在 数据 竞争 隐患 。 虽 然 当 前 示例 内 容 不 会 有 什么 危害 ， 
但 是 多 个 线程 对 同一 个 可 变 变 量 进行 写 操 作 比 较 危 险 。 对 此 上 段 代 人 码 进 行 
HVE, Fae arse iki ON RRR: 
error[E0382]: capture of moved value: `s` 
> | thread::spawn(move || { 
fT M value moved (into closure) here 
6 | S.push BET” hello"); 


| 八 


value captured here after move 


错误 信息 提示 使 用 了 所 有 权 已 经 家 移动 的 值 s， 违 反 了 了 Rust 所有权 
机 制 | 。 在 这 里 Rust 有 所有权 机 制 帮助 发 现 了 一 个 潜在 的 风险 。 
如 果 想 在 多 个 线程 中 共享 s， 则 需要 使 用 Rc 或 Arc。 现 在 已 经 知道 Rc 
PER Send， 但 是 可 以 答 试 使 用 它 足 线程 共享 所 有 权 ， 看 看 会 及 生 什 
么 情况 ， 如 代码 清单 11-18 所 示 。 
代码 清单 11-18: 尝试 使 用 Rc 共享 所 有 权 


1. use std::thread; 


ie USS Shirt re: she; 
3. fn maing) { 
4. let MUL & = Ket snew( "Hello" te Strang ()) 7 
IM Dor 3m Used 4{ 
6. let mut S&S clone = s.clone(); 
Ts thread: :spawn (move || { 
8. 5 Clone push Str(™ hello”) 
9 . }); 
10. } 
Lle J 


TEAS is 11-18 A Rc As S Aes, PRR TEIR (CH 1 H clone yy 
法 来 共 诗 所 有 权 。 编 译 该 段 代码 ， 编 译 占 会 报 出 如 下 和 错 谋 : 


error[H02Z?7/|: the trait Pound “stdtire: sRetstd: ?tren String? 
std::marker::Send’ is not satisfied in ~[closure@src/main.rs: 
i O71) S Cloneyends irai tiO rn i String] © 
7 | thread::spawn(move || { 
| SA SOROS Rn Cannot. Dé 


sent between threads safely 


通过 错误 信息 可 知 ，spawn 图 数 传 入 的 财 包 没有 实现 Send， 这 是 因 
为 捕获 变量 没有 实现 Send。 ae 实现 的 是 ! 
Send， 正 好 和 Send 相 反 。 同 时 ， 错 误 信 息 最 后 一 句 也 提示 了 Rc< String 

> 不 能 在 线程 间 进 行 安 全 移动 。 这 是 因为 Re<T> 底 层 不 是 原子 操作 ， 
有 可 能 发 生 多 个 线程 同时 修改 引用 计数 噩 的 情况 ， 存 在 数据 竞争 。 编 译 
e ee eee Fe 
BEPRRC<T> AGT, ABA HHRMA VATE E Ze Fe I] A 0 oh SE SE 


Arc<T>， 如 代码 清单 11-19 所 示 。 
代码 清单 11-19: 使 用 Arc 共 享 所 有 权 


Le Se SEd: thread: 

44. USE Stade: syncs: Arg 

3. fn main() { 

4. let & = AFG! tnew( "Hello" .tS SLEIN)? 
Bic fOr am O..3 4 

Gs iet s clone = s.clone{) ; 

Ts thread::spawn(move || { 

Bis S CLONE. Push, SECT" worlel”) 7 
9 . } ) 7 

10. } 

ile J 


在 代码 清单 11-19 中 ， 使 用 Arc 华 换 了 Rc， 但 是 纺 详 时 还 是 会 报 出 如 
PHA: 
error[E0596]: cannot borrow immutable borrowed content as mutable 
8 | s clone push str(" world!™); 


| LLEVA ARIAS 


Cannot borrow as mutable 

th eis BH, FER AES VE ee, EIA Arc<T 
二 默认 是 不 可 变 的 。 如 果 想 完成 目标 ， 还 需要 使 用 具备 内 部 可 变性 的 类 
型 ， 比 如 Cell、RefCell 等 。 现 在 我 们 已 经 知道 ，Cell 和 RefCell 均 是 线程 
不 安全 的 容器 类 型 ， 它 们 实现 了 ! Sync， 无 法 路 线程 共享 。 代 码 清单 
11-20 展 示 了 使 用 RefCell 来 支持 内 部 可 变性 。 

代码 清单 11-20: 使 用 RefCell 支 持 内 部 可 变性 


use std::thread; 
use std: syncs :Arc; 
use std::cell::RefCell; 


CA taints 4 


O OO sl © UA & Ww fH HP 


let & = Are: tnew (RerCel Le iDEN me Le EO string ()))} 
tor am Vewd { 
let Ss clons = ¢,olone() 7 
thread: :spawn (move || { 
s let g €lonme = 8 Elone. barrow müt (jj 
10. s clone push str(" world”) ; 
LT, }); 
Les } 
Lo 


在 代码 清单 11-20 中 ， 使 用 RefCel 来 提供 内 部 可 变性 ， 但 是 编译 时 
依旧 会 报 出 如 下 错误 : 
error[E0277]: the trait bound 
std: rceliz:RetCell<std:: strings :String>rstd: marker: Syng 1s not 
satisfied 
8 | thread::spawn(move || { 

| OE RAMAN | Seas Peele {REECE Less StAL I SCEno 

cannot be shared between threads safely 

该 错误 信息 表明 ，RefCell<String 之 没有 实现 Sync， 但 是 Arc 只 文 持 
实现 Sync 的 类 型 。 同 时 ， 销 误 信 息 最 后 一 句 也 提示 了 RefCell<String> 
不 能 在 线程 间 安 全 共有 蛙 。 纲 详 磊 又 一 次 避免 了 线程 不 安全 的 风险 。 


11.2.3 使 用 锁 进 行 线程 同步 

要 修复 代码 清单 11-20 中 的 错误 ， 只 需要 使 用 文 持 路 线程 安全 共 吝 
可 变 变 量 的 容 右 即 可 ， 所 以 可 以 使 用 Rust 提 供 的 Mutex 二 TT 二 > 类型， 如 代 
人 码 清 日 11-21 所 示 。 

代码 清早 11-21: 使 用 Mutex 在 多 线程 环境 中 共享 可 变 变 量 


use std::thread; 
use Star:sync::{Are, Mutex}; 
th. tiga} 7 
let & = Arcs tnew(Mutex: new ("Hello”.to string()))7 


R 

2 

3 

4 

Toa let mut v = vec![]; 
6 Con 26 Os.8 4 
T 

8 

9 


let s alone = sxclone) 5 
let child = thread: :spawn (move || { 
let. MUE 8 clone = d Clone. lock) -Unwrap () ; 
LU a s clone.push str(” world”); 
Lis Hi7 
La Y. PUSAN (Cha) 2 
LB. } 
14. bor hild amv 4 
Lg onila: ein) -ununuran 
iR } 
Lre -1 


编译 代码 清单 11-21， 终 于 不 再 报错 了 ， 可 以 说 设 段 代码 实现 了 线 
程 安全 。 因 为 Mutex 消 除了 跟 线 程 写 操 作 有 的 数据 苋 搜 风险 ， 里 然 存 在 苋 
态 条 件 《〈 比 如 push_str 操 作 会 乱 序 执行 ) ， 但 束 当 前 示例 而 言 ， 属 于 民 
TE TEAS SRE o 

HJF CMutex ) 

Mutex<T> 其 实 丈 是 Rust 实 现 的 互 斥 锁 ， 用 于 保护 共享 数据 。 如 
果 类 型 T 实 现 了 Send， 那 么 Mutex<T > 会 自动 实现 Send 和 Sync。 在 互 斥 
锁 的 保护 下 ， 每 次 只 能 有 一 个 线程 有 权限 访问 数据 ， 但 在 访问 数据 之 
六 ， 必 须 通 过 调用 lock 方 法 阻力 当前 线程 ， 直 到 得 到 互 斥 锁 ， 才 能 得 到 
访问 权限 。 

Mute, <T> ŽW KMA lock ”方法 会 返回 一 1 LockResult< 
MutexGuard<T> >W, LockResult<T> std: : Sync 模块 中 定义 的 
BIRA, MutexGuard<T>2£FRAITI 机 制 实现 ， 只 要 超出 作用 域 范 围 
吏 会 目 动 释放 锁 。 另 外 ，Mutex 雪 工 > 也 实现 了 try_lock 方 法 ， 访 方法 在 
获取 锁 的 时 候 不 会 阻 守 当 前 线程 ， 如 果 得 到 锁 ， 束 返回 MutexGuard<T 
>; 如 林 得 不 到 锁 ， 束 返回 Err。 


S ANE X Tine A TE xe Ah FE 


ATREA TMN, PEEHI, ee EAN SS TE Ze FETA 1% 
播 。 当 子 线程 友 生 错误 时 ， 因 为 Rust 基 于 人 返回 人 的 错误 处 理 机 制 ， 也 让 
跨 线 程 错误 处 理 变 得 非常 方便 。std: : thread: : JoinHandle 实 现 的 join 
方法 会 返回 Result<T 之 ， 当 于 线程 内 部 发 生灵 颁 时 ， 设 方法 会 返回 
Frr， 但 是 通 第 不 会 对 此 类 Err 进 行 处 理 ， ee de 如 
果 获 取 到 合法 的 结果 ， 则 正常 使 用 ;， 如 果 是 Err， 则 故意 让 父 线程 也 友 
生 娩 丑 ， 这 样 束 可 以 把 子 线程 的 恐 屋 传播 到 父 线 程 ， RERAN 

(Ae URGE TER REN UR TL A“ HP 
(Posion) ”， 示 例如 代码 清单 11-22 所 示 。 


代码 清单 11-22: “中 毒 ”示例 


Ls usé Sos SYVnes rT {Ae MICEX) i 

2. use std::thread; 

Se I. teint) ¢{ 

4. let mutex = Arc: :new(Mutex::new(1)); 
am let c mutex = mutex.clone(); 

Sin lec = thread:zspawn(move || { 

Th Let mut deta = © MUTEX: LOGEN) sutiwrap() 7 
S *data = 2; 

9 . panie! ("SiL noe") 3 

Le Fla 7OLn() 

Lly assert eg! (mutex: Is poisoned() yr CEUS) 
LZ. match mutex.lock() { 

Lee Ok( J => unreachable! (), 

14. Err(p err) => 4 

LS s let gata = p errget rer ()7 

LG. println! ("recovered: {}", data); 
les } 

LB F 

Low d 


在 代码 清单 11-22 中 ， 代 码 第 6 一 10 行 ， 在 子 线程 内 部 使 用 panic! & 
故意 制造 了 一 个 候 慨 。 需 要 注意 的 是 ， 代 码 第 ”8 行使 用 解 引用 操 


作 “*” 来 获取 data 中 的 数据 ， 因 为 data Æ&MutexGuard <T> XH, 17% 
型 实现 了 Deref 和 DerefMut。 

代码 第 11 行 ， 使 用 is_poisoned 方法 来 下 看 获得 互 斥 锁 的 子 线程 是 否 
RÆ T Ree. TRASH12~18 行 ，main 主线 程 通过 lock 方法 获得 锁 ， 
为 子 线 程 内 部 反 生 了 榴 恢 ， 所 以 主线 程 调用 这 个 lock 方 法 束 会 返回 Err， 
这 里 直接 处 理 了 Er 的 情况。 该 Err 是 PoisonError< 工 > 之 类型， 提供 了 
get_ref 或 get_mut 方 法 ， 可 以 得 到 其 内 部 包装 的 TIT 类型， 所 以 代码 第 16 行 
束 可 以 对 data 数 据 进行 打印 直接 输出 “recovered: 3”. 

HE EM 

MEHZ ARERR — PS AE oe, EA EMM, A 
定 连 续 扼 出 正面 10RA. KHEDE, FERIER — BOA 
币 ， 然 后 分 别 统计 每 一 轮 硼 硬币 的 总 次 数 和 8 个 线程 的 平均 拖 便 币 次 
BX o 

AG fis 22 5 PE A eR, OTs 11-23. 

代码 清单 11-23: BEF A A ek 2 


Le Estern Crate Tandi 

2. fn maint) ¢ 

3.  // TODO 

4. } 

9. fn flip simulate(target flips: uo4, total flips: Arc<Mutex<u6o4>>) { 
om let mut. continue positive = 0; 

Ty let mut iter counts = 0; 

8 while Continue positive <= Target. Tlips: | 

2. tee Counte f= 1j 

LY let pro or con = rands; random () ; 

Is if pro or con 4 

Las Continue positive += L 

LS } else { 

14. continue positive = 0; 

13s } 

16: } 

Lull printin: (“ater eountss {}", iter counts) ; 

LB let mut total flips = total flips.lock() .unwrap () ; 
13, “total flips += iter counts; 

20s | 


在 代码 清单 11-23 中 引入 了 rand 4, (rand: : random 函 数 来 获 
取 随 机 的 bool 奖 型 表示 正 反 面 。 

代码 第 5 一 20 行 ， 实 现 了 模拟 撕 人 硬币 冰 数 flip_simulate， 其 中 第 一 个 
参数 target_flips 表 示 要 达到 的 正面 天 上 目标 数 ， 第 二 个 参数 total_flips 表 
示 总 拓 便 币 次 数 。 这 里 total_flips 需 要 累计 在 多 个 线程 内 手 便 币 次 数 的 总 
和 ， 属 于 多 线程 共享 的 可 变数 据 ， 故 使 用 Arc<Mutex<<64 之 之 类 型 。 

代码 第 6 行 和 第 7 行 ， 分 别 声明 了 continue_positive 和 iter_counts 来 表 
IRIE EIN HG TE TED AS BA A AT RL o 

代 人 码 第 8 一 16 行 ， 在 while 表 达 式 中 模拟 撕 人 硬币 ， 下 到 
continue_positiv 次 数 达 到 目标 次 数 target_flips 为 止 。 其 中 代码 第 9 行 ， 
每 次 循环 都 昧 计 一 次 掷 便 币 次 数 : 代码 第 10 行 ， 调 用 rand: : random 
函数 模拟 掷 便 币 ， 访 图 数 是 一 个 汉 型 国 数 ， 但 这 里 没有 指定 具体 的 类 
型 ， 征 因为 代码 第 11 一 15 行 是 it 条 件 表 达 式 ，Rust 编 详 茶 可 以 据 此 目 动 


推 炳 出 随机 函数 值 的 类 型 ， 这 里 为 bool 类 型 。 当 rand: : random% 2k 
回 true 时 ，continue_positiv 的 值 昧 计 加 1， 然 后 进行 下 一 次 循环 。 

代码 第 18 行 ， 调 用 互 斥 体 total_flips 的 lock 方 法 获取 锁 ， 然 后 在 代码 
第 19 行 将 当前 线程 的 搬 便 币 识 数 iter_counts 素 加 到 total_flips 中 。 

接 下 来 在 main 函 数 中 生成 8 个 线程 进行 挪 人 硬币 实验 ， 如 代码 清单 11- 
24 所 不 。 

代码 清单 11-24: 完善 main 函 数 


l. extern crate rand; 

2. use std::thread; 

3. use stdi:synes:{Arc, Mutex}; 

4. fn main() { 

Bis let total flips = Arc::new(Mutex: :new(0)); 

6, let completed = Arc: :new(Mutex: :new(0)); 

Ts let runs = 8; 

8. let Target. Tlips = 10} 

9. fox if 0.. Euns | 

LU, let. total flips = total flips.elenei() ; 

Ll: let completed = completed.clone(); 

12. thread::spawn(move || { 

Le. flip simulate(target flips, total flips); 

14. let mut completed = completed.lock() .unwrap() ; 
LB *completed += 1; 

16. }) 7 

i p } 

LB ， loop { 

13s let completed = completed.lock().unwrap(); 

ZU x if *completed == runs { 

2 上 
Ze. println! ("Final average: {}", *total flips / *completed) ; 
F break; 

24. } 

25. } 

Loe | 


“ls fn flip simulate(target flips: uo4, total flips: Arc<Mutex<u6o4>>) { 
28. // 同 代码 清单 11-23 
29. } 

在 代码 清单 ”11-24 中， 定义 了 两 个 互 斥 体 变 量 total_flips ”和 
completed。 其 中 total_flips#K IH ZANE HBL, completed FUK 
皂 便 币 实 验 完 成 的 忌 线程 数 。 

代码 第 9 一 17 行 ， 执 行 for 循 环 生成 8 个 线程 ， 在 线程 中 调用 


flip_simulate 函 数 来 模拟 掷 硬币 。 第 14 行 和 第 15 行 ， 通 过 调用 互 斥 体 
completed 的 lock 方 法 获取 到 互 斥 锁 ， 在 掷 硬币 完成 之 后 对 该 线程 进行 计 


数 。 
代码 第 18 一 25 行 ， 利 用 loop 循 环 3 


等 待 所 有 子 线程 完成 掷 硬币 任 


务 。 代 码 第 20 行 ， 如 果 所 有 的 线程 都 完成 了 掷 硬 币 任 务 ， 那 么 用 总 掷 硬 
币 次 数 除 以 完成 掷 硬币 任务 的 线程 总 数 ， 就 可 以 得 到 掷 硬币 的 平均 数 。 
代码 清单 11-24 的 执行 结果 如 代码 清单 11-25 所 示 。 


代码 清单 11-25: 执行 结 


Leer Counts: 
LESE Counts? 
Leer counts: 
Lber counts: 
1ter counts: 
Lter counts: 
iter counts: 


iter counts: 


204 

Lose 
1464 
1460 
1974 
423 

9913 
5447 


Final average: 2800 
每 次 执行 都 会 得 到 不 同 的 结果 。 需 要 注意 的 是 ， 在 本 次 掷 硬币 实验 
的 代码 中 ， 使 用 Mutex 二 TIT 二 保护 的 是 在 多 个 线程 之 间 共 于 的 数据 ， 对 
于 那些 在 函数 中 使 用 的 局 部 变量 ， 献 认 束 是 线程 安全 的 。 
上 面 的 代码 执行 古 没 有 问题 的 ， 但 如 来 修改 一 下 束 可 能 友和 生死 锁 


(Deadlock) ， 如 代码 清单 11-26 所 示 。 
代码 清单 11-26: 会 产生 死 锁 的 代码 


fn main() { 
// 同 代 码 清单 11-24 
// loop 循环 的 整 段 代 码 用 下 面 四 行 代 码 来 替换 
let completed = completed.lock().unwrap(); 


let total flips = total flips.lock().unwrap (); 
println! ("Final average: {}", *total flips / *completed); 
} 
fn. simulate (target flips: U64, total flips: Are<Mutex<u64>>) 1 
0. // 同 代码 清单 11-23 
Lis 4 

在 代码 清单 11-26 中 ， 只 对 代 人 得 请 单 11-24 中 的 loop 循 环 的 整 段 代码 
进行 了 蔡 换 ， 其 余部 分 不 变 。 人 代码 第 4 一 7 行 和 之 前 loop 循 环 的 代码 相 
比 ， 缺 少 了 对 完成 线程 总 数 和 运行 线程 数 的 判断 以 及 break。 访 段 代 三 
在 Playgroud A 平台 执行 时 会 发 生死 锁 ， 报 出 如 下 错误 ; 

/root/entrypoint.sh: line 7: 5 Killed 
timeout --signal=KILL S${timeout} "S@" 

该 超时 错误 是 Playground 平 台 的 错误 ， 但 它 是 由 死 锁 引起 的 。 这 是 
因为 main 主 线程 一 直 持 有 对 completed 互 斥 体 的 锁 ， 将 会 导致 所 有 的 模 
拟 据 人 硬币 的 子 线程 阻塞 。 子 线程 阻塞 以 后 ， 束 无 法 更 新 completed 的 值 
了 了， 同时 ，main 主 线程 还 在 等 每 子 线 程 完成 任务 。 这 束 造 成 了 死 锁 。 

Rust 里 然 可 以 避免 数据 苋 争 ， 但 不 能 完全 避免 其 他 问题 ， 比 如 死 
Ol, bn Zee A BIT AH SS 

读 写 锁 CRwLock ) 

在 std: : sync 模块 中 还 提供 了 为 外 一 种 锁 一 一 读 写 氏 RwLock<T 
>. RwLock<T>A#lMutex<T>+72U, Ale ARZEF, RwLock<T 
二 对 线程 进行 读者 (Reader) 和 写 者 (Writer) 的 区 分 ， 不 像 Mutex 
<T 之 只 能 独占 访问 。 访 锁 文 持 多 个 谈 线 程 和 一 个 与 线程 ， 其 中 旋 线 程 
只 人 允许 进行 只 旋 访 问 ， 而 与 线程 只 能 进行 独占 写 操 作 。 只 要 线程 没有 拿 
到 与 饥 ，RwLock<T> 吏 允许 任意 数量 的 谈 线 程 获 得 谈 锁 。 和 Mnutex 去 
T> 一 样 ，RwLock<T> 也 会 因为 恐慌 而 “中 毒 ”。 

代码 清单 11-27 展 示 了 一 个 该 写 锁 示例 。 


2 
3 
4 
se while *completed < runs {} 
6 
7 
8 
9 
1 


代码 清单 11-27: 读 写 锁 示 例 


if nse Stas :synes s<Rwhock; 

2 fn main() { 

3 let lock = RwLock: :new(5) ; 

4 { 

Sa let rl = lock.read().unwrap(); 
6 let r2 = lock.read().unwrap(); 
q assert eg: ("tly Dy 

8 5 60! (r2; 3) F 

9. } 

LO; { 

Lis let mut w = lock.write().unwrap() ; 
lzé *w += 1; 

Ls assert. eqi(*w, 6); 

14. } 

los d 
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写 锁 才能 在 离开 作用 域 之 后 目 动 释放 ; TWS EREM, AAMAS 
锁 不 能 同时 存在 。 

11.2.4 屏障 和 条 件 变量 

Rust 除 文 持 互 斥 锁 和 读 写 锁 之 外 ， 还 支持 屏障 (Barrier) 和 条 件 
变量 (Condition Variable) 同步 原 语 。 代 码 清单 11-28 展 示 了 一 个 屏障 
示例 。 

代码 清单 11-28: 屏障 示例 


use Stat isynes:{Are, Barrier: 
use std::thread; 
fn maint) í 


let. mut. handles = Vec:iwith capacity (5) ; 


0: =] OF} OF & GW Po FO 


let barrier = Arc::new(Barrier::new(5)); 
Por 28 Dard q 
let c = barrier.clone(); 
handles.push(thread::spawn(move|| { 


zA println! ("before wait"); 
Ls G: Walt} 
上 由 声 Prancini (“alter Wale”) ¢ 
Le FASS 
LI a } 
14. for handle in handles { 
LS handle.join() .unwrap(); 
LG a } 
lje J 
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11-29 所 示 。 

代码 清单 11-29: 屏障 示例 输出 结 

before wait 
before wait 
before wait 
before wait 
before wait 
after wait 
after wait 
after wait 
after wait 
after wait 

一 共 5 个 线程 ， 但 输出 结果 束 好 像 是 线程 局“ 一 刀 从 中 间 切 成 两 

半 ” 一 样 。 实 际 上 是 wait 方 法 阻 豆 了 这 5 个 线程 ， 等 全 部 线程 执行 守 前 半 


部 分 操作 之 后 ， 骨 开始 后 半 部 分 操作 。 屏 障 一 般 用 于 实现 线程 同步 。 
条 件 变 量 ” 跟 屏障 有 把 相 似 ， 但 它 不 是 阻 瑟 全 部 线程 ， 而 是 在 满足 
引 定 条 件 之 前 阻 奢 茶 一 个 得 到 互 斥 锁 的 线程 。 代 码 清单 11-30 展 示 了 一 
个 条 件 变 量 示 例 。 
代码 清单 11-30: 条 件 变 量 示例 


lL». use Std? Syncs: {Are, Condvar, Mitexl: 

2. use std::thread; 

Se Ta Man) ¢ 

4. let pair = Arc::new((Mutex::new(false), Condvar::new())); 
Bes tet parit Clone = palf. dllone}; 

Ga thread: :spawn (move || { 

Ta let &(rer lock, TeL cvar) = &*pair clone; 
Bie let mut started = lock.lock().unwrap(); 
9. xstarted = true; 

LQ 4 cvar.notify one(); 

LIe E 

LZ. let &(ref lock, ref cvar) = &*pair; 

13 let mut started = lock.lock().unwrap(); 

14. while !*started { 

15. arinen!" p"; rd dr False 

1 started = CVar.walt (started) .unwrap ();，; 

i printin! ("{}", started)» // true 

Lae s } 

Loy 3 


在 代码 清单 11-30 中 ， 代 人 码 第 4 TEA AR eA a ee ee S 
Arc< (Mutex<bool>, Condvar) 之 类 型 的 变量 pair。 
过 调用 lock 方 法 获得 互 斥 锁 ， 然 后 修改 其 中 包 侣 的 ”bool ”类 型 数据 为 
true。 在 修改 完 之 后 ， 通 过 调用 条 件 变 量 的 notify_one 方 法 通知 主线 程 。 
代码 第 12 一 18 行 ， 得 到 互 斥 体 lock 的 互 斥 锁 ， 在 while 循 环 中 通过 条 
件 变 量 的 wait 方 法 阻力 当前 main 主 线程 ， 直 到 子 线程 中 started 互 斥 体 中 
的 条 件 变 为 true。 


这 里 值得 注意 的 是 ， 在 运行 中 每 个 条 件 变 量 每 次 只 能 和 一 个 互 斥 
体 一 起 使 用 “”。 在 有 些 线程 需要 获取 东 个 状态 成 立 的 情况 下 ， 如 采 单 独 
使 用 互 斥 锁 会 比较 当 费 系统 资源 ， 因 为 只 有 多 次 出 入 临界 区 才能 获取 到 
东 个 状态 的 信息 。 此 时 束 可 以 配合 使 用 条 件 变量 ， 当 状态 成 立时 通知 互 
厅 体 吏 可 以 ， 因 此 减少 了 系统 资源 的 痕 宽 。 


11.2.5 原子 类 型 


互 斥 锁 、 谈 与 锁 等 同步 原 语 确实 可 以 满 正 基本 的 线程 安全 需求 ， 但 
征 有 时 候 使 用 锁 会 影响 性 能 ， 其 至 存在 死 锁 之 类 的 风险 ， 因 此 引入 了 原 
FRA. 

原子 类 型 内 部 封 冯 了 编程 语言 和 操作 系统 的 “契约 ”， 基 于 此 外 约 来 
实现 一 些 目 市 原子 操作 的 类 型 ， 而 不 需要 对 其 使 用 锁 来 体 证 原子 性 ， 从 
而 实现 无 饥 〈Lock-Free) 并 友 编 程 。 这 个 夏 约 殉 是 多 线程 内 存 模 型 
Rust 的 多 线程 内 存 模型 借鉴 于 C++11， 它 保证 了 多 线程 并 发 的 顺序 一 致 
性 ， 不 会 因为 确 层 的 各 种 优化 重 排 行为 而 失去 原子 性 。 

对 于 开发 者 来 说 ， 如 果 说 编程 语言 提供 的 锁 机 制 属于 “日 盒 ” 操 作 的 
话 ， 那 么 原子 闫 型 瓯 属于“ 黑 全 ”操作 。 做 个 简单 的 类 比 。 锁 机 制 就 相当 
于 目 家 的 厨房 ， 你 可 以 和 目 由 使 用 各 种 厨具 和 食材 做 出 想 要 的 美食 ， 整 个 
过 程 对 你 是 透明 的 ;而 原子 其 型 相当 于 去 餐馆 ， 你 只 能 选择 玉 单 上 提供 
的 菜品 ， 然 后 交 由 餐馆 后 厨 来 大 你 完成 ， 整 个 过 程 是 建立 在 对 和 餐馆 信任 
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“Load ， 表 示 从 一 个 原子 类 型 内 部 读 取 值 。 

“ Store ， 表 示 往 一 个 原子 类 型 内 部 写 入 值 。 

- 各 种 提供 原子 “ 谈 取 -修改 -号 入 ”的 操作 。 

>CAS (Compare-And-Swap) ， 表 示 比 较 并 交换 。 

二 Swap ， 表 示 原 子 交 的 操作 。 

>Compare-Exchange ， 表 示 比 较 / 交 欣 操 作 。 


>Fetch-* , #7 fetch add. fetch sub. fetch and 和 fetch or 等 一 系 
列 原子 的 加 减 或 逻辑 运算 。 


> Eh. 
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排 会 导致 线程 不 安全 的 问题 。 

Rust 标 准 库 中 提供 的 原子 类 型 

在 Rust 标准 库 std: : sync: : atomic 模块 中 暂时 提供 了 4 个 稳定 
的 原子 类 型 ， 分 别 是 AtomicBool、AtomicIsize、AtomicPtr 和 
AtomicUsize， 另 外 还 有 很 多 基本 的 原子 类 型 会 逐步 稳定 。 这 些 原 子 炎 
型 均 提 供 了 一 系列 原子 操作 。 代 人 码 清单 11-31 展 示 了 使 用 原子 类 型 实现 
一 个 简单 的 目 旋 锁 (Spinlock) 。 

代码 清单 11-31: 使 用 原子 次 型 实现 一 个 徐 单 的 目 旋 锁 


| 

2x use std::synei:atomic:: {AtomicUsize, Ordering}; 
3 use std::thread; 
4 fn main() { 
5 let spinlock = Arc::new(AtomicUsize::new(l1)); 
6. IET Spin Geek clones = berm loek.elone()2 
7 let thread = thread::spawn(move|| { 
8 spinlock clone.store(U, Ordering: riencet}? 
9 b)e 
LO 4 while spinlock.load(Ordering::SeqCst) != 0 {} 
a(t ba Lf let Err (páni) = thread.join() | 
Laa printin! ("Thread had am errors irri", panic); 
13% } 
Lame a 


在 代码 清单 11-31 中 ， 使 用 了 AtomicUsize 原子 类 型 。 原 子 类 型 本 身 
里 然 可 以 你 证 原子 性 ， 但 它 目 身 不 提供 在 多 线程 中 共有 至 的 方法 ， 所 以 需 
要 使 用 Arc<T> 将 其 跨 线 程 共 享 ， 如 代码 第 5 行 所 示 。 

代 但 第 7 一 9 行 ， 在 spawn 函 数 生成 的 子 线程 中 ， 通 过 调用 
spinlock_clone 的 Store 方法， 将 其 内 部 AtomicUsize 类 型 的 值 写 为 0。 

代码 第 10 行 ， 在 main 主 线程 中 使 用 spinlock 的 load 方 法 读 取 其 内 部 原 
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并 且 做 了 相应 的 错误 处 理 。 

这 里 值得 注意 的 是 ， 在 使 用 store 和 load 这 两 种 原子 操作 的 时 候 ， 
参数 中 都 出 现 了 Ordering: : SeqCst， 并 且 在 代码 第 2 行 中 也 引入 了 
Ordering 关 型 。 

由 存 顺序 

原子 类 型 除 提 供 基 本 的 原子 操作 之 外 ， 还 提供 了 内 存 顺 序 参 数 。 为 
了 帮助 理解 ， 可 以 将 该 参数 次 比 为 在 餐馆 吃饭 时 ， 虽 然后 厨 对 用 户 来 说 
是 一 个 “ 黑 盒 ”， 但 可 以 通过 给 每 个 这 品 额外 这 加 备注 来 议 置 少 盐 、 微 状 
等 俩 好 有 要求。 同样 ， 每 个 原子 类 型 虽然 对 开发 者 而 言 是 一 个 “ 黑 盒 ”， 但 
也 可 以 通过 提供 内 存 顺 序 参数 来 控制 底层 线程 执行 顺序 的 参数 。 控 制 内 
存 顺 序 实 际 上 残 是 控制 展 层 线程 同步 ， 以 便 消 除 辰 层 因 为 编译 大 优化 或 
Bo EHE A Fe Sl ACA SEAS ARE 

在 std: : sync: : atomic: : Ordering 模 块 中 定义 了 Rust 支 持 的 5 种 
内 存 顺 序 ， 如 代码 清单 11-32 所 示 。 

代码 清单 11-32: 在 std: : sync: : atomic: : Ordering 模 块 中 定 
义 的 5 种 内 容 顺 友 

pub enum Ordering { 
Relaxed, 


Release, 


AcgRel, 


1 
2 
3 
4. Acquire, 
5 
6 SeqCst, 


Ta } 


在 代码 清单 11-32 中 展示 的 这 5 种 内 存 顺 序 ， 实 际 上 可 以 归 为 三 大 
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:排序 一 致 性 顺序 : Ordering: : SeqCst. 
目 由 顺序 : Ordering: : Relaxed. 


获取 -释放 顺序 : Ordering: : Release. Ordering: : Acquire#ll 
Ordering: : AcqRel. 

Rust 3c FF SAHA MR -5 ER LL VM SEFF WY AN II ee E 
的 。 

排序 一 致 性 顺序 ”和 古 最 和 直观、 最 简单 的 内 存 顺 序 ， 它 规定 使 用 排序 
一 致 性 顺序 ， 也 就 是 指定 Ordering: : SeqCst 的 原子 操作 ， 都 必须 是 先 
存储 〈store) 再 加 载 〈load) > XEIRA, ZIENA R, PA KIE 
子 写 操作 都 必须 在 读 操 作 之 前 完成 。 通 过 这 种 规定 ， 束 强行 指定 了 后 层 
多 线程 的 执行 顺序 ， 从 而 傈 证 了 多 线程 中 所 有 操作 的 全 局 一 致 性 。 但 是 
简单 是 要 付出 代价 的 ， 这 种 方式 需要 对 所 有 的 线程 进行 全 局 同步 ， 这 了 束 
存在 性 能 损耗 。 可 以 使 用 下 和 餐馆 进行 类 比 ， 每 位 和 人 都 存在 点 单 和 结账 
爽 种 状态 ， 使 用 排序 一 致 性 顺序 相当 于 强制 要 求 所 有 需要 结账 的 客人 ， 
必须 等 所 有 点 单 的 客户 完成 之 后 才 可 以 结账 。 

目 由 顺序 ”正好 是 排序 一 致 性 顺序 的 对 立 面 ， 顾 名 思 义 ， 它 完全 不 
会 对 线程 的 顺 友 进行 干涉 。 也 就 是 说 ， 线 程 只 进行 原子 操作 ， 但 线程 之 
间 会 存在 苋 态 条 件 。 使 用 这 种 内 存 顺 友 是 比较 危险 的 ， 只 有 在 明确 了 解 
当前 使 用 场景 且 必 须 使 用 它 的 情况 下 (比如 只 有 读 操 作 〉， ， 才 可 使 用 目 
由 顺序 。 

医 取 -释放 顺序 ， 是 除 排 序 一 致 性 顺序 之 外 的 优先 选择 。 这 种 内 
存 顺 序 并 不 会 对 全 部 的 线程 进行 统一 强制 性 的 执行 顺序 要 求 。 在 该 内 存 
顺序 中 ，store 代 表 释 放 (Release) 语义 ， 而 load 代 表 获 取 (Acquire) if 
义 ， 通 过 这 两 种 操作 的 协作 实现 线程 同步 。 其 中 ，Ordering: : Release 
表示 使 用 该 顺序 的 store 操 作 ， 之 前 所 有 的 操作 对 于 使 用 Ordering: : 
Acquire J$ load EARE ILA; 反之 亦 然 ， 使 用 Ordering: : 
Acquire 顺 序 的 load 操 作对 于 使 用 Ordering: : Releasef‘/storefe#/F Ah P] 
WHJ; Ordering: : AcqRel 代 表 谍 时 使 用 Ordering: : Acquirelllii Hy 
load 操 作 ， 写 时 使 用 Ordering: : Release 顺 序 的 Store 操作 。 

锋 取 -释放 顺序 虽然 不 像 排 序 一 任性 顺序 那样 对 全 局 线程 统一 排 
序 ， 但 是 它 让 每 个 线程 都 能 按 固定 的 顺序 执行 。 同 样 使 用 下 餐馆 进行 类 
比 ， 每 位 客人 都 存在 点 单 和 结账 两 种 状态 ， 假 定 宪 人 A 的 点 单 由 服务 员 
甲 负 责 ， 但 是 结账 时 由 服务 员 乙 来 进行 ， 不 可 能 及 生 在 结账 时 服务 员 
过 来 册 重 新 为 其 点 单 的 情况 ， 对 于 各 人 A 来 说 ， 在 餐馆 吃饭 的 流程 苯 守 


回 定 的 顺序 即 可 。 

在 日 剃 开 友 过 程 中 ， 如 何 选 择 内 存 顺 序 呢 ?这 和 压 层 价 件 环境 也 有 
关系 ， 一 般 情况 下 建议 使 用 Ordering: : SeqCst。 在 需要 性 能 优化 的 情 
况 下 ， 先 调研 并 友 程序 运行 的 便 件 环境， 下 优先 选择 获取 -释放 顺序 
(Ordering: : Release. Ordering: : Acquire 和 Ordering: : AcqRelf% 
需 选 择 ) 。 除 非 必要 ， 人 否则 不 要 使 用 Ordering: : Relaxed. 


11.2.6 使 用 Channel 进 行 线程 间 通 信 


坊间 流传 看 一 句 非常 经 典 的 话 : 不 要 通过 共享 内 存 来 通信 ， 而 应 
该 使 用 通信 米 共 享 内 和 存 ”。 这 人 句 话 中 级 含 着 一 种 古老 的 编程 哲学 ， 那 束 
FWA eh, IEA eA Be ay WR SR SEA TE 

基于 消息 通信 的 并 发 模型 主要 有 两 种 : Actor 模型 和 CSP 模型。 
Actor 模 型 的 代表 语言 是 Erlang， 而 CSP 模 型 的 代表 语言 是 Golang。 这 两 
种 并 发 模型 的 区 别 如 下 : 

在 Actor 模 型 中 ， 主 角 是 Actor，Actor 之 间 直 接 发 送 、 接 收 消 息 ; 
而 在 CSP 横 型 中 ， 主 角 是 Channel， 其 并 不 关注 谁 发 送 消 息 、 谁 接收 消 
oo 

:在 Actor 模 型 中 ，Actor 之 加 是 直接 通信 有 的 ;而 在 CSP 模 型 中 ， 依 徘 
Channel 来 通信 。 

Actor 模 型 的 灰 合 程度 要 高 于 CSP 模 型 ， 因 为 CSP 模 型 不 关注 消息 
RIE RUPE -o 
图 11-6 展 示 了 Actor 模 型 和 和 CSP 模型 的 区 别 。 


TLL 


Channel 





图 11-6: Actor 模 型 和 CSP 模 型 的 区 别 

这 两 种 模型 都 存在 了 很 多 年 ， 随 着 Golang 语 言 的 出 现 ，CSP 模 型 再 
次 回 到 开 及 者 的 视线 中 。Rust 标 准 库 也 选择 实现 了 CSP 并 发 模 型 。 

CSP 并 友 模 型 

CSP (Communicating Sequential Processes， 通 信 上 顺序 进程 ) 是 一 个 
精确 摘 述 并 发 的 数学 理论 ， 基 于 访 理 论 构建 的 并 发 程序 不 会 出 现 稼 见 的 
问题 ， 并 且 可 以 得 到 数学 证 明 。CSP 对 程序 中 每 个 阶段 所 包含 对 象 的 行 
为 进行 精确 的 指定 和 验证 ， 它 对 并 发 程序 的 设计 影响 深远 。 

CSP 模 型 的 基本 构造 是 CSP 进 程 和 通信 通道 。 注 意 ， 此 处 CSP 进 
程 是 并 及 模型 中 的 概念 ， 不 是 操作 系统 中 的 进程 。 在 CSP 中 每 个 事件 都 
征 进 程 ， 进 程 之 间 没 有 直接 交互 ， 只 能 通过 通信 通道 来 交互 。CSP 进 程 
通 音 是 匿名 的 ， 通 信 通 道 传 递 消 居 通常 使 用 同步 方式 。 

CSP 理 论 在 很 多 语言 中 得 以 实现 ， 包 括 Java、Golang 和 Rust 和 等。 在 
Rust 的 实现 中 ， 线 程 束 是 CSP 进 程 ， 而 通信 通道 束 是 Channel。 在 Rust 标 
准 库 的 std: : sync: : mpsc 模 块 中 为 线程 提供 了 Channel 机 制 ， 其 具体 
实现 实际 上 是 一 个 多 生产 者 日 消费 者 (Multi-Producer-Single- 
Consumer, MPSC) 的 先进 先 出 (FIFO〉 队 列 。 线 程 通 过 Channel 进行 
通信 ， 从 而 可 以 实现 无 锁 并 发。 

生产 者 消费 者 模式 与 Channel 

生产 者 消费 者 模式 是 指 通过 一 个 中 间 层 来 解决 数据 生产 者 和 消费 者 
之 间 的 硒 合 问题 。 生 产 者 和 消费 者 之 间 不 直接 通信 ， 而 是 分 别 与 中 国 层 


进行 通信 。 生 产 者 同 中 间 层 生产 数据 ， 消 费 者 从 中 辐 层 获取 数据 进行 消 
费 ， 这 样 束 巧妙 地 平衡 了 生产 者 和 消费 者 对 数据 的 处 理 能 

一 般 情 况 下 ， 使 用 一 个 FIFO 队列 来 充当 中 间 层 。 在 多 线程 环境 
下 ， 生 产 者 束 是 生产 数据 的 线程 ， 消 费 者 就 是 消费 数据 的 线程 。Rust 实 
现 的 是 多 生产 者 单 消 费 者 模式 ， 如 图 11-7 所 示 。 


生产 者 1 
图 产 者 
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生产 省 2 FIFO 队列 





图 11-7: 多 生产 者 单 消费 者 模式 示意 岁 

这 个 FIFO 队 列 就 是 CSP 模 型 中 Channel 的 具体 实现 。 在 标准 库 
std: : sync: : mpsc 模 块 中 定义 了 以 下 三 种 类 型 的 CSP 进 程 : 

“ Sender ， 用 于 发 送 异 步 消 恩 。 

-SyncSender , HT Rik T 

‘Receiver ， 用 于 接收 消 恩 。 

Rust 中 的 Channel 包 括 两 种 类 型 : 

异步 无 界 Channel ” ， 对 应 于 channel 函 数 ， 会 返回 (Sender, 
Receiver) 7c2H. ChannelRIKI REO, FAAS. CH 
， 古 指 在 理论 上 绥 冲 区 是 无 限 的 。 
同步 有 界 Channel ， 对 应 于 sync_channel 疯 数 ， 会 返回 

(SyncSender, Receiver) 元 组 。 议 Channel 可 以 预 分 配 上 共有 国定 大 小 
WZIX, JRA ARORA ZEN, SAPKA SABER AIS, Eb 
到 有 可 用 的 绥 剖 空间 。 当 该 Channel 绥 冲 区 大 小 为 0 时 ， 惑 会 变 成 一 
个 “点 ”， 在 这 种 情况 下 ，Sender 和 Receiver 之 间 的 消息 传递 是 原子 操 
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Channel 之 则 的 发 送 或 接收 操作 都 会 返回 一 个 Result 类 型 用 于 错误 处 
理 。 当 Channel 发 生意 外 时 会 返回 Err， 所 以 通常 使 用 unwrap 在 线程 间 传 
播 销 误 ， 及 早 及 现 问 题 。 

代 但 清单 11-33 展 示 了 两 个 线程 之 间 使 用 Channel 通 信 的 简单 示例 。 

代码 清单 11-33: 两 个 线程 之 间 使 用 Channel 通 信 的 简单 示例 


1. use std::thread; 


Že use stds:syncs :mpsca: : channel ; 

Ss tin maing) i 

a let (tx, rx) = channel (); 

Dia thread: :spawn (move|| { 

Bin tx.send(10).unwrap(); 

Ta pi 

8. assert eq. (rx. recv() <Unwrap(), LO); 
2 J 


在 代码 清单 11-33 中 ， 代 码 第 4 行 ， 使 用 channel 函 数 创建 了 一 个 用 于 
线程 间 通 信 的 通道 ， 返 回 的 元 组 Ctx, rx) 1S! 称 作 通 道 的 两 端 (Port) 
RIK sin 和 接收 如 。 

代码 第 5~~7 行 ， 使 用 spawn 生 成 子 线程 ， 并 在 该 子 线程 中 使 用 tx 六 
口 调用 send 方 法 癌 Channel 中 发 送 消 恩 。 

代码 第 8 行 ， 在 main 主 线程 中 使 用 rx 病 口 调用 recv 方 法 接收 消 晨 。 这 
样 就 简单 地 使 用 Channel 实 现 了 线程 间 通 信 。 

像 代 但 清单 11-33 这 种 只 有 两 个 线程 通信 的 Channel， 叫 作 流 通道 

(Streaming Channel)  。 在 流通 道内 部 ， 实 际 上 Rust 会 默认 使 用 单 生 
产 者 单 消费 者 队列 CSPSC) 来 提升 性 能 。 
代码 清单 11-34 展 示 了 多 生产 者 使 用 Channel 通 信 的 示例 。 
代码 清 单 11-34: 多 生产 者 使 用 Channel 通 信 示 例 
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use std::thread; 


use std? synes smpse: : channel; 


TH, Wert) 4 
let (tx, rx) = channel (); 
for 4 25 0...10 4 
let tx = tx.clone(); 
thread::spawn(move|| { 


tx.send(i).unwrap() ; 


ror i Valy l 
let 3 = rx.recv().unwrap(); 
assert! (0 <= j && J < 10); 


} 


在 代码 清单 11-34 中 ， 人 代码 第 5 一 10 行 ， 在 for 循 环 中 生成 了 10 个 子 线 
程 ， 同 时 ， 也 将 发 送 端 区 拷贝 了 10 次 ， 于 是 束 产 生 了 10 个 生产 者 。 

代码 第 11 一 14 行 ， 同 样 在 for 循 环 中 ， ne aa 

RA Aas 11-34 eh Er ae A eA Channel, ERM 
(Sharing Channel) . 

上 面 的 示例 均 为 异步 Channel， 人 代码 清单 11-35 展 示 了 使 用 同步 
Channel 通 信 的 示例 。 

代码 清单 11-35: 使 用 同步 Channel 通 信 示 例 


use St Bynes tps. syno channel 
use std::thread; 
TY. Watt) a 


LEE (CX; 28) = gyne Cannel (1) 7 


thread: :spawn (move | | { 
Ex, send (2) ,uriwrap () 3 
} ) 7 


2 
3 
4 
F tx.send(1).unwrap () ; 
6 
y 
8 
9 Assert eq! (rx. recy() unwrap (), 1); 


1D assert eq! (rx.recy() -unwrap(), <)F 
Tie J 


在 代码 清单 11-35 中 ， 人 代码 第 4 行 ， 使 用 sync_channel 函 数 创 建 了 一 
个 同步 Channel， 并 将 其 缓冲 区 大 小 设置 为 1。 

代码 第 5 行 ， 使 用 发 送 端 t 的 send 方 法 往 同 步 Channel 中 发 送 消息 。 

代码 第 6 一 8 行 ， 在 spawn ERM TARIEF AREH RA m tx AIK 
消 恩 。 但 是 因为 同步 Channel 的 绥 冲 区 大 小 只 为 1， 所 以 这 次 发 送 的 消 忆 
在 上 一 条 消 朋 被 消费 之 前 会 一 直 阻 罕 ， 直 到 Channel 中 绥 冲 区 有 可 用 空 
间 才 会 继续 发 送 。 

代 人 第 9 行 和 第 10 行 ， 使 用 接收 病 rx 来 消费 Channel 中 的 数据 。 如 果 
Ix 末 接收 到 数据 ， 则 会 友 生 您 刁 。 

Channel% 

并 不 是 没有 锁 束 不 会 发 生死 锁 行 为 。 请 看 代码 清单 11-36。 

代码 清单 11-36: 会 发 生死 锁 的 Channel 示 例 


Lla USE Stat: Ehread; 

i. Mee stds: syne: :mpsc: channel; 
Se $u Waa.) { 

4. let (tx, rx) = channel (); 
a Pom 2. 20 Ue. 4 

6. let tx = tx.clone(); 

Ta thread: :spawn (move || { 
R tx.send(i).unwrap(); 
a DF 

1G } 

il, ff drop tte) s 

lës för J i Beet ceri | 

13. printimi ("ieri ", 117 

14. } 

le J 


在 代码 清单 11-36 中 ， 调 用 了 rx 的 iter 方 法 得 到 一 个 近代 器 。 输 出 结 
果 如 下 : 


/root/entrypoint.sh: line 7: 5 Killed 
timeout --Signal=KILL S${timeout} "s@" 

0 

1 

4 

2 

3 

4 


该 输出 结果 是 在 Playground 平 台 编 译 执行 后 得 到 的 ， 除 正常 打印 从 0 
到 4 之 外 ， 还 有 一 个 entrypoint.sh 脚 本 杀 掉 超 时 进程 的 提示 。 这 说 明代 码 
清单 11-36 在 执行 过 程 中 会 发 生死 锁 。 

在 本 地 编译 该 段 代 码 吏 会 肥 现 ， 在 main 主 线程 得 出 从 0 到 4 结果 之 
后 ， 还 会 一 直 阻 考 main 主 线程 而 不 退出 。 这 是 因为 r 的 iter 方 法 会 阻 星 线 
Te, RBwMMCARHM, WARTS BSA, RA W 
析 构 之 后 ， 迭 代 妖 才能 返回 None， 从 而 结束 运 代 退出 main 主线 程 。 然 
m, XE tx FRR, HAREKET, tx 也 没有 发 送 新 的 消 


FA, MEN SPEIRS BERR REC H LR fa A, OR ig Bo N 
Fdrop7ri etx ir ea tA VA, Aaa 1 1-36"P 28 1147 WE BH AY 
再 来 看 万 外 一 个 示例 ， 如 代码 请 单 11-37 所 示 。 
代码 清单 11-37: ANF EIE Channels (| 
lL Use std::sync: :mpsc: :channel; 
2. use std::thread; 


3 fn main() { 

4 let (tx, rx) = channel (); 
5 thread: :spawn (move || { 
oe tx.send(lu8) .unwrap(); 
7 tx.send(2u8) .unwrap(); 
8 tx.send(3u8) .unwrap() ; 
9 }); 

IUa COE X In Falter | 

LI Prentin! ("recalvat {}", J) i 
I2, } 

ise J 


在 代码 清单 11-37 中 ， 也 通过 调用 rx 的 iter 方 法 获取 迭代 器 来 消费 tx 
发 送 的 消息 ， 但 是 访 段 代码 会 正常 编译 执行 ， 不 会 发 生死 锁 。 这 是 为 什 
AE? 注意 ， 在 代码 清单 11-36 中 创建 的 是 共享 通道 ， 而 在 代码 清单 
11-37 中 创建 的 是 流通 道 ， 也 就 是 多 个 Sender 和 单个 Sender 的 区 别 。 发 
大 六 tx 在 离开 spawn 作 用 域 之 后 会 调用 术 构 函数 drop， 在 drop 中 会 调用 tx 
内 部 的 drop_channel 方 法 来 断 开 (DISCONNECT) Channel. ~4Channel 
古 共 孚 通道 时 ， 在 for 循 环 中 调用 ft 的 clone 方 法， 当 Channel 是 流通 道 
时 ，tx 在 离开 子 线 程 作用 域 之 后 通过 析 构 函数 束 可 以 汤 开 Channels 之 
所 以 存在 这 样 的 区 别 ， 在 于 共 军 通 站 和 流通 道 展 层 的 构造 有 上 所 不 同 。 流 
TERR Bae SPSC ( 单 生 产 者 单 消 费 者 ) 队列 来 优化 性 能 ， 因 为 
流明 过 只 是 用 于 两 个 线程 之 间 的 通信 。 但 是 共 诗 通道 底层 使 用 的 还 是 
MPSC (多 生产 者 里 消 颖 者 ) 队列 ， 在 析 构 行为 上 比 流通 道 略为 复杂 。 
所 以 在 通 和 党 的 开发 过 程 中 ， 有 要 注意 这 两 类 Channel 有 的 区 别 。 

在 底层 不 管 是 SPSC 还 是 MPSC 队 列 ， 甚 至 是 同步 Channel 使 用 的 内 
置 独立 的 队列 ， 都 是 基于 链表 实现 的 “。 使 用 链表 的 好 处 束 是 可 以 提升 


PERE. Æ ERIN, JR eee TE RESELL oR BU AY; 在 消费 数 
daly, JR eee BE He PERSE oR BN AY . 

利用 Channel 模 拟 工 作 量 证 明 

接 下 来 ， 我 们 使 用 Channel 来 解决 一 个 来 目 数字 货币 领域 的 问题 。 
众所周知 ， 比 特 币 开创 了 数字 货币 时 代 ， 它 不 仅仅 音 新 了 金融 领域 ， 更 
重要 的 是 它 币 来 了 区 块 链 的 概念 。 区 块 链 采 用 窒 人 码 学 的 方法 来 保证 已 有 
的 数据 不 可 复 改 ， 采 用 共识 算法 为 新 增 的 数据 达成 共识 ， 这 完全 是 与 生 
俱 来 的 且 去 中 心 化 的 “公信 力 ”。 而 信任 是 人 类 社会 一 切 交 易 的 前 提 ， 于 
是 ， 这 种 信 助 于 黎 但 学 和 算法 取得 信任 的 区 坎 链 技术 ， 正 逐渐 成 为 当前 
互联 网 上 各 种 商业 信用 体 的 基础 设施 。 

在 比特 币 中 ， 最 流行 的 一 个 词 束 是 “ 挖 矿 ”。 这 个 词 极 上 其 诱惑 性 ， 听 
上 去 就 像 是 在 “ 挖 金 信 ”一 样 。 但 是 当 了 解 了 其 背后 的 搁 术 机 制 之 后 ， 碳 
不 会 产生 这 种 私 想 了 。 实 际 上 ,，“ 挖 矿 ” 就 是 比特 币 和 以 太 坊 中 的 一 种 共 
识 机 制 ， 用 专业 术语 来 说 ， 束 是 指 工 作 量 证 明 (Proof of Work, 
PoW) 。 

工作 量 证 明 机 制 其 实 不 是 比特 币 专 有 的 ， 其 存在 已 经 很 多 年 了 ， 基 
时 被 用 于 防范 拒绝 服务 攻击 等 领域 。 下 面 徐 单 用 一 个 示例 来 说 明 工 作 量 
证 明 机 制 的 基本 原理 。 

:给 定 一 个 字符 串 或 数字 ， 比 如 42。 

”给 定 一 个 工作 目标 : 找到 另外 一 个 数字 ， 要 求 访 数字 和 42 相 乘 后 
的 结果 ， 经 过 Hash 函 数 处 理 后 ， 满 足 得 到 的 加 蜜 字 串 以 “00000? 开 头 。 
可 以 通过 对 “00000” 增 加 或 减少 0 的 个 数 来 控制 查找 的 难度 。 

` 为 了 找到 这 个 数字 ， 需 要 从 数字 1 开始 递增 奏 找 ， 直 到 找到 满足 条 
件 的 数字 。 

要 找到 这 个 数字 ， 束 需要 大 量 的 计算 。 在 这 个 示例 中 ， 数 学 期 望 的 
TRAE LES”, BRS KINI Di eA Me LE SUE 
HA”, LESNAR RARER R. AAR, LER AID A 
真实 的 工作 量 证 明 算 法 比 这 个 示例 复杂 一 些 ， 但 原理 是 相似 的 。 

现在 ， 使 用 Rust 来 实现 上 述 示例 描述 的 模拟 工作 量 证 明 过 程 。 代 三 
结构 设计 如 下 : 

使 用 多 线程 来 加 速 查 找 过 程 。 


将 碍 找到 的 符合 条 件 的 数字 和 加 密 字 串通 过 Channel 传 递 到 万 外 一 
个 线程 中 并 输出 。 
工作 量 证 明 过 程 代 人 码 结构 示意 图 如 图 11-8 所 示 。 


> Find 
thread5 一 > and 


MPSC Channel 





图 11-8: 工作 量 证 明 过 程 代码 结构 示意 图 
为 了 简单 起 见 ， 将 整个 代码 都 写 到 同一 个 文件 中 。 接 下 来 ， 使 
用 cargo new--bin pow 创建 一 个 新 项 目 。 在 实现 此 过 程 中 ， 需 要 用 到 两 
个 第 三 方 包 一 一 用 来 求 Hash 值 的 rust-crypto 和 用 来 方便 迭代 的 itertools。 
自 先 在 Cargo.toml 文 件 中 洪 加 其 体 的 依赖 ， 如 代码 清单 11-38 所 示 。 
代码 清单 11-38: 在 Cargo.toml 文 件 中 添加 rust-crypto 和 和 itertools 依 
wi 


ees [dependencies] 
Z. itertools = "0.7.8" 
Ss FYUsBC=Ccrypte = "Wz" 


然后 在 mian.rs 文 件 中 引入 这 两 个 包 ， 如 代 但 清单 11-39 所 示 。 
代码 清单 11-39: 在 main.rs 文 件 中 引入 rust-crypto 和 itertools 


// extern crate itertools; 
// extern crate crypto; 
use itertools::Itertools; 
use cryptot: digest: :Digest; 
ervptos : shad = i Sn 
use std::thread; 
use Stadt: eyvner: (mpsc, Are}; 
wee std? :syner: atomic: :{AcomicBbool, Ordering}; 
const BASE: usize = 42; 
10, Const THREADS? uSize = 8; 
Lle Sbetbie DIFFICULTY: &'Static sty = MODU T: 
l2 « Struct Solwutien tisize, Siring) y 


在 代码 清单 11-39 中 ， 人 代码 第 1 一 5 行 ， 引 入 了 rust-crypto 和 itertools 中 
所 需要 的 模块 ， 此 处 使 用 Sha256 算 法 。 在 Rust 2018 中 ， 人 代码 第 1 行 和 第 2 
ITHE. 

代码 第 6 一 8 行 ， 分 别 引 入 了 线程 、MPSC、Arc 和 原子 类 型 
AtomicBool， 这 些 都 是 编写 该 并 有 友 程 序 时 所 需要 的 基本 工具 。 

代码 第 9 行 和 第 10 行 ， 分 别 定 义 了 币 量 BASE 和 THREADS， 用 来 存 
储 工 作 量 证 明示 例 中 基础 的 值 42 和 多 线程 的 线程 数 ， 方 便 修 改 和 复 用 。 

代码 第 11 行 ， 定 义 了 静态 全 局 字符 串 和 字面 量 DIFFICULTY， 可 以 随 
时 通过 修改 “0 的 位 数 来 调整 难度 ,，“0? 越 多 难度 越 高 ， 也 束 是 说 ， 答 找 
过 程 时 间 越 长 。 

代码 第 12 行 ， 定 义 了 Solution (usize，String) 元 组 结构 体 ， 用 来 记 
录 最 终 找到 的 数字 及 其 加 密 后 的 结 

接 下 来 实现 一 个 验证 图 数 ， 用 于 验证 所 找到 的 数字 是 售 满 足 条 件 ， 
如 代码 清单 11-40 所 示 。 

代码 清单 11-40: 在 main.rs 中 实现 验证 函数 tierify 


oOo OO =l 0 Ul RY H 
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// 接 上 

fn verify(number: usize) -> Option<Solution> { 
let mut hasher = Sha256::new(); 
hasher.input str(é& (number ~= BASH),.to string ())¢ 


let Dash! String = Masher: result str)? 
Lt hes. SLarLs WILDADIFFICUGIS) 4 

Some (Solution (number, hash) ) 
} else { None } 


O 0O = OF Oe G&G KR F 


e W 

代码 清单 11-40 中 的 验证 函数 很 和 窗 单 ， 它 接收 一 个 usize 类 型 的 数字 
number, i&|=|—~*Option<Solution> KA Wi, VAS uEN 2a RA PA 
种 可 能 : 解决 和 未 解决 。 

代码 第 3~5 行 ， 使 用 rust-crypto 包 提 供 的 ”Sha256 类 型 来 生成 
number 和 BASE 乘积 的 Hash 值 hash， 并 将 其 转换 为 String 字 人 符 串 。 

代码 第 6 一 8 行 ， 使 用 String 类 型 中 提供 的 starts_with 方 法 来 判断 hash 
征 售 以 DIFFICULTY 中 指定 的 字符 串 开 头 。 如 采 是 ， 则 返回 
Some (Solution (number, hash) ) ; 如 果 不 是 ， 就 返回 None。 

接 下 来 实现 奏 找 函 数 ， 如 代码 清单 11-41 所 示 。 

代码 清单 11-41:， 在 main.rs 中 实现 查找 函数 find 


1. // #4 

es sles i 

Bie start at: usizeé, 

4. sender: mpsc::Sender<Solution>, 

Ss is solution found: Arc<AtomicBool> 

6. ) { 

Ta ror number an. (start at..)-step [THREADS] 4 

Ss if vs solution found,load(OQrdering::Relaxed) | return; | 
9, if let Some(solution) = verify(number) { 

LH is solution found.store(true, Ordering: :Relaxed) ; 
hi sender.send(solution) .unwrap(); 

LZ. return; 

L3; } 

14. } 

Las] 


在 代码 清单 11-41 F, find ”图 数 一 共 需 要 三 个 参数 。 第 一 个 参 
Nstart_at 是 计算 的 起 始 数字 。 第 二 个 参数 sender 7Channel H] AIK i, 
其 类 型 是 mpsc: : Sender<Solution 之 ， 因 为 需要 将 Solution 类 型 的 值 通 
过 Channel 发 送 给 接收 线程 。 第 三 个 参数 is_solution found 用 来 记录 满足 
条 件 的 Solution 是 否 被 找到 ， 它 是 一 个 全 局 性 变量 ， 被 多 个 线程 操作 ， 
应 议 使 用 原子 尖 型 ， 所 以 将 其 设置 为 Arc 所 AtomicBool>。 

代码 第 7 行 ， 开 局 一 个 无 限 侯 增 的 循环 ， 以 start_at 为 起 点 ， 以 
THREADS 为 步 长 ， 直 到 找到 那个 满足 条 件 的 数字 。 以 THREADS 为 步 
长 ， 是 为 了 将 查找 的 目 然 数 进行 分 组 ， 以 便于 平均 划分 多 线程 任务 。 

代 人 码 第 8 行 ， 使 用 lo0ad 方 法 读 取 原子 类 型 is_solution_found 中 的 值 ， 

如 果 已 经 设 普 为 tue， 则 从 循环 中 提前 返回 ， 否 则 束 继 续 执 行 。 此 处 牙 
置 内 存 顺 序 为 自由 顺序 (Ordering: : Relaxed) 是 安全 的 ， 因 为 底层 
的 线程 执行 顺序 并 不 会 影响 到 find 函 数 的 结果 ， 同 时 也 提升 了 原子 操作 
的 性 能 。 

代码 第 9 一 13 行 ， 使 用 verify 函 数 验 证 循环 中 每 个 number 的 值 是 仿 满 
足 条 件 。 如 采 满 足 ， 则 使 用 store 方 法 将 is_solution_found 的 值 议 置 为 
true， 此 处 内 存 顺 序 同 样 使 用 目 由 顺序 。 然 后 将 碍 找到 的 信 solution 通 


过 Channel 及 送出 去 。 如 果 完 成 了 这 些 工作 ， 则 从 当前 循环 中 提前 返 
回 ， 人 个 则 继续 循环 。 
对 多 线程 任务 的 平均 划分 如 图 11-9 所 示 。 





图 11-9: 多 线程 任务 平均 划分 示意 图 


从 图 11-9 中 可 以 看 出 ， 一 共 8 个 线程 ， 所 以 每 个 线程 按 8 的 步 长 进行 
TERR, BEE DORMES FIIRT BK 8- SARE 

最 后 ， 完 善 mian 函 数 ， 如 代码 清单 11-42 所 示 。 

代码 清单 11-42: 在 main.rs 中 完善 main 函 数 


let 1s solution found = Arc::new(AtomicBool::new(false) ); 


1. // 上 

2. fn main() { 

Dis println! ("PoW : Find a number, 

4, SHA256 (the number * THY == NE \" e BASE, DLFFICULTY) : 
Ja println! ("Started {} threads", THREADS) ; 

6. println! ("Please wait... "); 

Ta 

8 


let (sender, receiver) = mpsc::channel (); 


9. for 1 if 0... THREADS 4 


10 Let sender n = sender.clone:() 7 

Lis let ig solution Tound = is solution Tound alons (g 
LZ; thread: :spawn (move || { 

La s pand(., sender i, 13 SOLUCION Toundj? 

14. }); 

15: } 

LGs match receiver.recv() { 

ine i OK (Soluticn(1, Kash)) => 4 

Ls printin! ("Found the solution: Ty; 

li princin! ("The number 16% {}, 

20. and hash result 16 £ {}s"; I; Bash)? 
ln Fa 

AZ y Err( ) => panic! ("Worker threads disconnected! "), 
23 } 

24. } 


在 代码 清单 11-42 中 ， 首 先 打 印 两 条 提示 信息 ， 包 括 此 次 工作 量 证 
明示 例 中 的 基数 、 难 度 字 串 和 线程 数 ， 如 代码 第 3 一 6 行 所 示 。 

代码 第 7 行 和 第 8 行 ， 分 别 声 明了 is_solution found 原子 类 型 和 
Channel， 此 处 is solution found 默认 设置 为 false。 

代码 第 9 一 15 行 ， 按 THREADS 指 定 的 线程 数 生 成 相应 的 子 线程 ， 并 
且 在 子 线程 中 执行 find 任 务 。 注 意 此 处 ， 在 find 函 数 内 部 已 经 通过 设置 
循环 步 长 完成 了 多 线程 任务 的 平均 划分 。 

代码 第 16 一 23 行 ， 通 过 调用 receiver 的 recv 方 法 来 阻塞 当前 main 主 线 
程 ， 等 待 接收 最 终 满 足 条 件 的 值 。 如 果 接 收 到 了 值 ， 则 将 其 打印 出 来 ; 
如 果 出 错 ， 则 制造 巩 令 来 报告 查找 失败 。 

至 此 ， 人 整个 代 但 实现 完毕 ， 只 需要 在 此 项 目的 根 目 录 下 执行 cargo 
run 命 令 即 可 运行 。 输 出 结果 如 代码 清单 11-43 所 示 。 

代码 清单 11-43: 工作 量 证 明示 例 输出 结果 


PoW : Find a number, SHA256 (the number * 42) == "00000...... ý 
Started 8 threads 

Please wait... 

Found the solution: 

The number DS: 834312, and hash result 1s 
00000a31988d8c179097b2753c509b11520£4b5470dc77£facedc5734£13d3394. 


在 整个 实现 过 程 中 需要 注意 以 下 几 个 地 方 : 
. 如 何 正确 地 分 离 生产 线程 和 消费 线程 ? 
. 如 何 正确 地 划分 并 发 任务 ? 
如 何 正确 地 识别 临界 区 ， 以 及 如 何 正确 地 使 用 原子 类 型 及 其 内 存 
顺序 ? 


11.2.7 内 部 可 变性 探 完 


在 Rust 提 供 的 并 有 编程 工具 中 ， 基 本 都 文 持 内 部 可 变性 ， 在 行为 上 
与 Cel<T> 之 、RefCell< 工 > 比较 相似 。 代 码 清单 11-44 展 示 了 Mutex 的 源 
AG SEAM o 

代码 清单 11-44: Mutex 源 码 实 现 

ls pub struct Mutex<T: ?SliZed> 1 
2 inner: Box<sys::Mutex>, 
Sa poison: polson::Filag, 

4 data: UnsafeCell<T>, 
6 } 

从 代码 清单 11-44 中 可 以 看 出 ，Mutex<T > 有 三 个 成 员 字 段 ， 即 
inner、poison 和 data。 其 中 inner 字段 包 闭 了 用 于 调用 搬 层 操作 系统 API 
的 sys: : Mutex; poison 用 于 标记 该 锁 是 否 已 “中毒 ”， data 是 锁 包 含 的 
数据 ， 使 用 了  UmsafeCell<T> ”类 型 。 由 此 来 看 ， 内 部 可 变性 是 由 
UnsafeCell<T > FEH. 

继续 查看 ”Cell<T> 、RefCell<T>、RwLock<T> 锁 、 原 子 类 型 
以 及 mpsc: : Sender 等 的 源码 实现 ， 如 代码 清早 11-45 所 示 。 

代码 清单 11-45: Cell<T>. RefCell<T>. RwLock<T>“FyRt4 
实现 


Le PUDO Aor bie, teal baie | 

wh value: UnsafeCell<T>, 

Bs } 

4. pub struct. RefCell<T: 281ze0> { 
<a borrow: Cell<BorrowFlag>, 

6. value: UnsafeCell<T>, 

Ta } 

Ss Hub BLEDNGL RwLock<T? 27912607F 1 
a, inner: Box<sys::RWLock>, 

LD 5 POLsem: polson: zr lag, 

Lia data? UnsaTecell<T>, 

lže 4 

13. Bub Struct. Atemiebool { 

eet v: UnsafeCell<u8>, 

lås J 

16. pub struct Sender<T> { 

| ing BE inner: UnsafeCell<Flavor<T>>, 
LB e | 

19. pub struct Receiver<T> { 

20 inner: UnsafeCell<Flavor<T>>, 
9 | 


从 代码 清单 11-45 中 可 以 看 出 ， 这 些 拥有 内 部 可 变性 的 结构 体 都 是 
基于 “UnsafeCell< 工 > 实现 的 。 继 续 和 否 看 UnsafeCell< 工 > 的 源码 实现 ， 
如 代码 清单 11-46 所 示 。 

代码 清单 11-46: UnsafeCell<T> R09 KIN 


1. #[lang = “unsafe cell"] 

2. pub struct UnsafeCell<T: ?Sized> { 

Sa value: T, 

4. } 

Bia impl<T: ?Sized> [Sync for UnsafeCell<T> {} 
6. impl<T: ?Sized> UnsafeCell<T> 4 

ie pub In geti(<¢selr) => *mut T { 

G. &self.value as *const T as *mut T 
S } 

We 3 


在 代码 清单 11-46 中 ，UnsafeCell<T > 只 是 一 个 泛 型 结构 体 ， 它 属 
于 语言 项 (Lang Item) ， 上 所 以 编译 硕 会 对 它 进 行 茶 种 特殊 的 照顾 。 

代码 第 5 行 ， 为 UnsafeCell< 工 > 实现 了 ! Sync， 因 为 单独 使 用 该 类 
型 并 不 能 保证 线程 安全 。 

UnsafeCell<T> 的 特别 之 处 在 于 第 7 行 和 第 8 行 实现 的 get 方法 ， 
通过 该 方法 可 以 将 UnsafeCell< 工 > 中 工 闫 型 的 不 可 变 借 用 转换 为 可 变 的 
原生 指针 (Raw Pointer) 。 在 get 方 法 内 部 ， 通 过 as 将 T 类 型 的 不 可 变 借 
用 先 转换 为 *counst T ， 再 转换 成 *mut 工 。 

一 般 来 说 ， 在 Rust 中 将 不 可 变 借 用 转换 为 可 变 借 用 属于 未 定义 行 
为 ， 编 译 絮 不 允许 开发 者 随意 对 这 两 种 引用 进行 相互 转换 。 但 是 ， 
UnsafeCell 天 工 > 是 唯一 的 例外 。 这 也 是 UnsafeCell< 工 > 属于 语言 项 的 
原因 ， 它 属于 Rust 中 将 不 可 变 转 换 为 可 变 的 唯一 合法 渠道 ， 对 于 使 用 
J UnsafeCell<T> MKH, SFA KAA Be 

风 此 ， 在 上 述 各 种 拥有 内 部 可 变性 的 容 右 内 部 均 使 用 了 UnsafeCell 
<T>, FAEN Rust 的 编译 器 安全 检查 。 


11.2.8 线程 池 


在 实际 应 用 中 ， 多 线程 并 友 更 沿用 的 方式 古 使 用 线程 池 。 线 程 里 然 
比 进程 轻 量 ， 但 如 朱 每 次 处 理 任 务 都 要 重新 创建 线程 的 话 ， 吏 会 寻 致 线 
程 过 多 ， 从 而 市 来 更 多 的 创建 和 调度 的 开销 。 采 用 线程 池 的 方式 ， 不 仅 
可 以 实现 对 线程 的 复 有 用， 避免 多 次 创建 、 销 毁 线 程 的 开销 ， 而 且 还 能 你 
证 内 核 可 以 被 充分 利用 。 


实现 一 个 线程 池 需 要 考虑 以 下 几 扣 。 
工作 线程 :用 于 处 理 具 体 任务 的 线程 。 
线程 池 初 始 化 : 即 通 过 设置 参数 指定 线程 池 的 初始 栈 大 小 、 名 
称 、 工 作 线 程 数 等 。 
- 待 处 理 任 务 的 存储 队列 : 工作 线程 数 是 有 限 的 ， 对 于 来 不 及 处 理 
的 任务 ， 需 要 暂时 保存 到 一 个 队列 中 。 
线程 池 管 理 : 即 管理 线程 池 中 的 任务 数 和 工作 线程 的 状态 。 比 
如 ， 在 没有 空 内 工作 线程 时 则 需要 等 每 ， 或 者 在 需要 时 阻 蛤 主线 程 等 竺 
所 有 任务 执行 完毕 。 
接 下 来 参考 第 三 方 包 threadpool 4! 的 实现 ， 来 说 明 如 何 使 用 Rust 标 
准 库 中 提供 的 并 有 工具 来 实现 一 个 简单 的 线程 池 。 
”线程 池 : 通过 创建 一 个 线程 池 结 构 体 来 控制 线程 池 的 初始 化 。 为 
此 结构 体 实 现 Builder 模 式 ， 定 制 初始 化 参数 ， 并 且 实 现 生 成 工作 线程 的 
ize 
- FARREZ LAS: 使 用 无 界 队 列 mpsc: : channel, RFA H 


线程 池 管 理 : 使 用 原子 类 型 对 工作 任务 状态 进行 计数 ， 达 到 管理 
的 目的 。 
这 个 简单 的 线程 池 模 型 示意 图 如 图 11-10 所 示 。 


MPSC Channel 
» thread 1 


> thread 2 


thread pool > thread 3 


> thread 4 
spawn_in_pool 





图 11-10: 简单 的 线程 池 模 型 示意 图 


使 用 cargo new--bin thread_pool 创建 一 个 新 项 目 thread_pool， 在 
Cargo.toml 文 件 中 添加 第 三 方 包 num_cpus 的 依赖 ， 如 代码 清单 11-47 上 所 
ZIN o 

代码 清单 11-47: 7ECargo.toml + 4s Jiinum_cpus{k $i 

Le [dependencies] 


2- Hum, cous = L. 87 
在 代码 清单 11-47 中 添加 的 num_cpus 依 赖 可 以 识别 当前 运行 的 计算 
机 中 CPU 的 个 数 ， 将 其 作为 线程 池 默 认 的 工作 线程 数 。 
在 main.rs 文 件 中 请 加 初始 化 代码 ， 如 代码 清单 11-48 所 示 。 
代码 清单 11-48: 在 main.rs 中 添加 初始 化 代码 


l. // extern crate num cpus; 

2 is use std::sync::mpsc::{channel, Sender, Receiver}; 
Su We stos:syrics 4400; Mutes, Concvar); 

4. Use SCdt:Synct atO: ts tAtomicusize, Ordering}: 
Js use std::thread; 

Ga trait EnBox { 

Ts in Call bos(selrl: Box<selt>) ; 

3. } 

Qe inpil<F: FnoOnce G> EnBox for F { 

LÜ rm call pox{seli; BoxsF>) { 

i (*self) () 

alta } 

a | 


14. type Thunk<'a> = Box<FnBox + Send + ‘a>; 


在 代码 清单 11-48 中 引入 了 num_cpus 包 。 同 时 ， 在 代码 第 2 行 引 入 了 
channel、Sender 和 Receiver， 随 后 会 使 用 它们 来 管理 工作 任务 。 在 代码 
第 3 行 和 第 4 行 引 入 了 Arc、Mutex、Condvar 和 AtomicUsize， 随 后 会 用 
到 。 在 代码 第 5 行 引 入 了 thread 模 块 ， 需 要 用 它 来 生成 具体 的 工作 线程 。 

值得 注意 的 是 代码 第 6 一 13 行 ， 定 义 了 FnBox trait， 并 为 FnOnce 的 
闭 包 实现 了 该 trait， 在 call_box 方法 中 执行 团 包 调用 。 这 样 做 是 为 了 如 
WILH H! [feature (fnbox) ] 特性 ， 可 以 回想 一 下 第 6 章 的 内 容 。 

代码 第 14 行 ， 使 用 type 定 义 了 一 个 类 型 别名 ， 这 是 为 了 人 简化 代码 。 


为 了 让 线程 池 中 维护 的 线程 可 以 共 圣 相同 的 数据 ， 还 需要 一 个 


数据 的 结构 体 ， 如 代码 清单 11-49 所 示 。 
代码 清单 11-49: 在 main.rs 中 添加 ThreadPoolSharedData 结 构 体 


As 
26. 


// #5 
struct ThreadPoolSharedData { 
name: Option<String>, 
job receiver: Mutex<Receiver<Thunk<' static>>>, 
empty trigger: Mutex<()>, 
empty condvar: Condvar, 
queued count: AtomicUsize, 
active count: AtomicUsize, 
max thread count: AtomicUsize, 
panic count: AtomicUsize, 
stack size: Option<usize>, 
} 
impl ThreadPoolSharedData { 
fn nas work(&selt) -> bool i 
self .queued count..lead (Ordering: :SeqCst) > D 
| | 
salt. active count.load (Ordering: :SeqCst) > 0 
} 
fn no work notify all(é&self) { 
if !self.has work() { 
“selt.empty trigger. lock () 


村 上 


ZN 


era 


享 


.expect ("Unable to notify all joining threads"); 


self .empty condvar .notify all) ; 


在 代码 清单 11-49 中 ， 定 义 了 ThreadPoolSharedData 结 构 体 ， 如 代码 
第 2 一 12 行 所 示 ， 其 中 字段 的 合 义 如 下 : 
. name ， 用 于 标记 线程 的 名 称 ， 线 程 池 内 的 线程 都 用 统一 的 名 称 。 
该 人 可 有 可 无 ， 所 以 使 用 Option 和 String 之 类 型 。 


-job_receiver ， 用 于 存储 从 Channel FEES AE Crx) , 
pk Ak AMutex<Receiver<Thunk<'’ static> >>, BANS AJE 
Als F, Reveiver<Thunk<’ static> >X% A REN EHE, NIA 
ERZE, Weta. UeAkThunk<'’  static>{t(#Box< 
FnBox+Send+’ static>, ZEVTN AUS DAA. 

empty_trigger 和 empty_condvar  ， 分 别 是 Mutex< () 之 和 
Condvar， 代 表 空 锁 和 空 的 条 件 变 量 ， 用 于 实现 线程 池 的 join 方 法 ， 条 件 
AP set a Ze AC ARM Be ES o 

- queued_count #lactive_count ， 人 代表 线 程 池 中 的 总 队列 数 和 正在 
执行 任务 的 工作 线程 数 。 因 为 是 多 线程 操作 ， 所 以 使 用 原子 类 型 
AtomicUsize 来 保证 原子 性 。 

-max_thread count ， 人 代表 线 程 池 人 允许 的 最 大 工作 线程 数 。 

-panic_count ， 用 于 记录 线程 池 中 发 生 芍 屋 的 工作 线程 数 ， 同 样 使 
用 原子 类 型 AtomicUsize 来 保证 原子 性 。 

stack_size ， 用 于 设置 工作 线程 栈 大 小 ， 可 有 可 无 ， 所 以 为 Option 
<usize 之 类 型 。 如 果 不 设置 栈 大 小 ， 则 默认 为 8MB。 

AR AS 14~1847, AThreadPoolSharedDataSc i, Y has work 方 法 ， 

当 queued_count 大 于 0 或 active_count 大 于 0 时 ， 表 示 线 程 池 人 处 于 正常 工作 
状态 。 

代码 第 19 一 25 行 ， 实 现 了 no_work_notify all 方法， 通过 has_work 方 
法 判断 线程 池 的 工作 状态 。 如 果 线 程 池 中 的 工作 线程 处 于 闲置 状态 ， 则 
代表 所 有 任务 均 以 完成 ， 那 么 通过 empty_trigger 拿 到 锁 ， 再 调用 
empty_condvarfJnotify_all 77 E KEA PA BBE A EAE ER IEAA. 1K 
方法 用 于 配合 线程 池 的 join 方法 。 

接 下 来 需要 一 个 线程 池 结 构 体 ， 如 代码 清单 11-50 所 示 。 

代码 清单 11-50: 在 main.rs 中 添加 ThreadPool 结 构 体 


le fi ikk 

2. pub struct ThreadPool { 

3 jobs: Sender<Thunk<'static>>, 

4. shared data: Arc<ThreadPoolSharedData>, 

Oe d 

6. impl ThreadPool { 

Ts pub fn new(num threads: usize) -> ThreadPool { 

8. Builder: :new().num threads (num threads) .build() 
Jy } 

10, pub fn execute<F>(&self, job: F) 

E s where F: FnOnce() + Send + 'static 

Ld { 

bP self:shared dara 

14. „guened count.fetch add(1, Ordering: :SeqCst) ; 
13 self.jobs.send (Box: :new(job) ) 

16. expect ("unable to send job into queue."); 
Los } 

18. pub fn join(éself) { 

19. if self.shared data.has work() == false { 

20 return (); 

a } 

LE» let mut lock = self.shared data.empty trigger.lock().unwrap () ; 
23a while self.shared data.has work() 1 

24. lock = self.shared data 

fd. .empty condvar.wait (lock) .unwrap () ; 

26. } 

2I., } 

28. } 


在 代码 清单 11-50 中 ， 定 义 了 ThreadPool 结 构 体 ， 如 代码 第 2 一 5 行 所 
示 ， 其 包含 如 下 两 个 字段 : 
- jobs ， 用 于 存储 Channel 发 送 端 (tx) ， 使 用 它 给 工作 线程 发 送 
FLSA ES, AySender<Thunk<’ static 盖 之 类 型 。 
shared_data ， 记 录 工 作 线程 共 孚 的 数据 ， 为 Arc<< 


ThreadPoolSharedData> 2248 . 

代码 第 7 一 9 行 ， 实 现 了 了 new 方法， 用 于 初始 化 线程 池 。 在 该 方法 中 
使 用 构建 者 模式 来 定制 生成 工作 线程 。 

WAG 10~17 47, 实现 了 execute 方法 ， 用 于 将 任务 添加 到 
Channel 队列 中 ， 同 时 使 用 AtomicUsize 的 fetch_add 方 法 将 queued_count 
宗 加 一 次 。 可 以 通过 此 方法 同 队 列 中 多 次 添加 任务 。 

代码 第 18 一 27 行 ， 实 现 了 join 方法 ， 访 方法 用 于 在 需要 时 阳 堵 主线 
时 等 街 线程 池 中 的 所 有 任务 执行 完毕 。 代 码 第 19 一 21 行 ， 判 断 线程 季 如 
条 处 于 困 置 状态 ， 则 提前 返回 。 人 代码 第 22 行 ， 通 过 shared_data 中 的 
empty_trigger 来 获得 互 斥 锁 。 在 代码 第 23 一 26 行 的 while 循 环 中 ， 如 有 果 线 
程 季 中 的 工作 线程 一 下 处 于 正音 工作 状态 ， 则 调用 empty_condvar 的 wait 
方法 来 阻 玫 当前 线程 ， 直 到 获得 解除 阻 融 的 通知 〈 如 notify_all) 。 

接 下 来 创建 初始 化 线程 池 需 要 用 到 的 Builder 结 构 体 和 build 方 法 ， 如 
代码 清单 11-51 所 示 。 

代码 清单 11-51: 在 main.rs 中 添加 Builder 结 构 体 及 其 方法 


ON DO SP WN FE 


WO 


// 接 上 

#[derive(Clone, Default) ] 

pub struct Builder { 
num threads: Option<usize>, 
thread name: Option<String>, 
thread stack size: Option<usize>, 


} 
impl Builder { 
pub fn new() -> Builder { 
Builder { 
num threads: None, 
thread name: None, 
thread stack size: None, 


} 
pub fn num threads (mut self, num threads: usize) -> Builder 
assert! (num threads > 0); 
self.num_threads = Some (num_threads) ; 
self 
} 
pub fn build(self) -> ThreadPool { 
let (tx, rx) = channel: :<Thunk<'static>>(); 
let num threads = self.num_ threads 
-unwrap or else (num cpus::get); 
let shared data = Arc::new(ThreadPoolSharedData { 
name: self.thread name, 
job receiver: Mutex: :new(rx), 
empty condvar: Condvar::new(), 
empty trigger: Mutex::new(()), 
queued count: AtomicUsize::new(0), 
active count: AtomicUsize: :new(0), 
max thread count: AtomicUsize::new(num_ threads), 
panic count: AtomicUsize::new(0), 
stack size: self.thread. stack size, 


for in O..num threads 1 

spawn in pool(shared data.clone()); 
} 
ThreadPool { 

Jobs: tx, 

shared data: shared data, 


在 代码 清单 11-51 中 ， 定 义 了 Builder 结 构 体 ， 其 包含 三 个 字段 : 
num threads. thread name 和 thread stack size， 分别 表示 要 创建 的 工作 
线程 数 、 线 程 名 称 和 线程 栈 大 小 ， 均 为 可 选 类 型 ， 如 代 伍 第 3 一 7 行 所 
ZN o 

代码 第 9 一 15 行 ， 为 Builder 结 构 体 实现 了 new 方 法 ， 生 成 一 个 字段 初 
始 值 均 为 None 的 Builder 实 例 。 

代码 第 16 一 20 行 ， 实 现 了 num_threads 方 法 ， 通 过 参数 可 以 设置 工作 
线程 数 。 

代码 第 21 一 43 行 ， 实 现 了 build 方 法 ， 用 于 初始 化 最 终 的 线程 地 。 代 
但 第 22 行 ， 使 用 channel 函 数 创建 一 个 无 界 队 列 。 人 代码 第 23 行 和 第 24 行 ， 
通过 num_threads 得 到 工作 线程 数 ， 如 果 没 有 设置 ， 则 默认 使 用 
num_cpus: : get 方 法 返回 当前 计算 机 的 CPU 核心 数 。 人 代码 第 25 一 35 
行 ， 初 始 化 了 一 个 ThreadPoolSharedData 实 例 ， 并 将 其 放 到 Arc 中 。 代 三 
第 36 一 38 行 ， 通 过 迭代 num threads 次 来 生成 相应 的 工作 线程 ， 其 中 
spawn_in_pool 冰 数 用 于 生成 工作 线程 。 代 码 第 39 一 42 行 ， 返 回 最 终 初 始 
化 完成 的 ThreadPool 实 例 。 

代码 清单 11-52 展 示 了 spawn_in_pool 函 数 的 具体 实现 。 

代码 清单 11-52: spawn_in_pool 函 数 的 具体 实现 


// #4 
fn spawn in pool(shared data: Arc<ThreadPoolSharedData>) { 


let mut builder = thread: :Builder::new() ; 
if let Some(ref name) = shared data.name { 
builder = builder.name(name.clone()); 
if let Some(ref stack size) = shared data.stack size { 
builder = builder.stack size(stack size.to owned()); 
builder.spawn(move || { 
let sentinel = Sentinel::new(&shared data); 
loop { 
let thread counter val = shared data 
-active count.load(Ordering: :Acquire) ; 
let max thread count val = shared data 
‘max thread _count.load(Ordering: :Relaxed) ; 
if thread counter val >= max thread count val { 
break; 
let message = { 
let lock = shared data.job receiver.lock() 
.expect ("unable to lock job receiver"); 
lock. recv () 
} ; 
let job = match message { 
Ok (Job) => job, 
Err(..) => break, 
}; 
shared data.queued count.fetch sub(1, Ordering: :SeqCst) ; 
shared data.active count.fetch add(1, Ordering: :SeqCst) ; 
job.call box(); 
shared data.active count.fetch sub(1, Ordering: :SeqCst) ; 


ae shared data.no work notify all(); 


34. } 

35 4 sentinel.cancel () ; 
Gem }) -unwrap() ; 

STe |} 


在 代码 清单 11-52 中 ， 第 3 一 9 行 ， 通 过 shared_data 中 存储 的 name 和 
stack_size 来 定制 生成 线程 。 注 意 此 处 使 用 的 是 thread 模块 的 
Builder: : new 方法 ， 而 非 当 前 main.rs 中 定义 的 Builder。 

代码 第 10 一 36 行 ， 使 用 builder.spawn 方 法 来 创建 工作 线程 。 

代码 第 11 行 中 的 Sentinel 结 构 体 用 来 对 其 体 的 工作 线程 进行 监控 。 

代码 第 12 一 34 行 为 一 个 loop 循 环 ， 用 于 阻 融 当前 工作 线程 从 任务 队 
列 中 取 有 具体 的 任务 来 执行 。 代 码 第 13 行 和 第 14 行 ， 得 到 当前 任务 队列 中 
的 active_count， 注 意 这 里 load 方 法 使 用 的 内 存 顺 序 为 Ordering: : 
Acquire， 代 表 1load 方 法 能 看 到 之 前 所 有 线程 对 active_count 所 做 的 修改 。 
而 代码 第 15 行 和 第 16 行 ， 获 取 max_thread_count 数目 使 用 的 内 存 顺序 
为 Ordering: : Relaxed， 这 是 因为 max_thread_count 的 值 不 会 被 的 层 线 
程 读 取 顺 友 有 影响 到 ， 使 用 上 自由 顺 友 可 以 提升 性 能 。 

代码 第 17 一 19 行 ， 如 果 工 作 队 列 数 大 于 最 大 的 线程 数 ， 则 退出 此 循 
 « 
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列 中 获取 任务 。 但 此 时 并 未 执行 任务 。 

代码 第 25 一 28 行 ， 通 过 match 匹 配 从 message 中 得 到 其 体 的 财 包 任 
务 ， 当 message 是 错误 类 型 时 则 跳出 循环 。 

代码 第 29 行 和 第 30 行 ， 将 shared_data 中 的 queued_count 减 1， 因 为 已 
经 从 任务 队列 中 取 a 到 了 一 个 任务 ， 那 么 任务 队列 中 的 任务 数 束 会 减 1。 
将 active_count 通 过 fetch_add 加 1， 因 为 当前 工作 线程 即将 对 该 任务 进行 
处 理 ， 那 么 正在 执行 任务 的 工作 线程 数 束 应 该 加 1。 

代码 第 31 行 ， 通 过 调用 job 的 call_box 方 法 来 执行 有 具体 的 任务 。 

代码 第 32 行 ， 在 执行 完 任 务 之 后 ， 将 active_count 减 1， 表 示 该 工作 
线程 随时 可 以 接受 下 一 个 任务 。 

代码 第 33 行 ， 通 过 调用 shared_data 的 no_work_notify_all 方法 ， 
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代码 第 35 行 ， 使 用 cancel 方 法 设置 sentinel 实 例 的 状态 ， 表 示 访 线程 

正常 执行 完 所 有 任务 。 
代 但 清单 11-53 展 示 了 Sentinel 的 其 体 定 义 。 
代码 清单 11-53: Sentinel 的 具体 定义 

// 接 上 

struct Sentinel<'a> { 

shared data: &'a Arc<ThreadPoolSharedData>, 


active: bool, 


} 
impl<'a> Sentinel<'a> 1 
fn new(shared data: &'a Arc<ThreadPoolSharedData>) 


~—] OF OO oo GW NH H 


8. -> Sentinel<'a> { 


Sa Sentinel { 

10s Shared datas Shared data, 

lia I active: true, 

12 a } 

La } 

14. fn cancel(mut self) 4 

15% self.active = false; 

lG. } 

Tod we | 

lf» TS Drop Tor sentinel<"am { 

19; fn drop(&mut self) { 

B a if self.active { 

al. self. shared data.active: count 

ZZ « sfetch subil; Ordering: :SeqCst) ; 

Bos it thread: spanicking() { 

24. self.shared data.panic count 

Ade : fetch add(l, Ordering: :5eqCst);}; 

G6 } 

ad Sell se6iared Gata. work notify alli); 

20s Spawn in pool (self.shared data.clone ()) 

eae } 

JUa } 

ale d 

在 代码 清单 11-53 中 ， 代 码 第 2~5 行 定义 了 Sentinel<’ a> t 
体 ， 其 中 包含 shared_data#llactive Zf, 2 FE’ a Arc< 


ThreadPoolSharedData> 之 和 bool 类 型 。 访 结构 体 用 于 监控 当前 工作 线程 的 
工作 状态 ，shared_data 字 段 用 来 包装 线程 池 共 至 数据 ， 而 active 字 段 如 末 
为 tue， 则 代表 当前 工作 线程 正在 工作 ， 如 果 为 false， 则 代表 当前 工作 
线程 正常 执行 完毕 。 

代码 第 6 一 17 行 ， 实 现 了 new 和 cancel 方 法 ， 分 别 用 于 创建 Sentinel 去 
' a 二 实例 和 设置 active 状 态 为 false。 

代码 第 18 一 30 行 ， 为 Sentinel<′a> 实 现 了 Drop， 用 于 处 理 处 于 非 


正常 工作 状态 的 工作 线程 。 当 工作 线程 〈 见 代码 清单 11-52) 中 的 
Sentinel 二 a 二 实例 离开 作用 域 时 会 调用 析 构 函数 drop。 在 该 函数 中 ， 
会 判断 当前 Sentinel<”a> 实 例 的 状态 ， 如 果 是 true， 则 证 明 广 工作 线 
程 并 未 正 间 退出， 所 以 会 依次 执行 第 21 一 28 行 代码 。 

代码 第 21 行 和 第 22 行 将 active_count 减 1， 将 当前 工作 线程 正常 归还 
到 线程 池 中 。 代 但 第 23 一 26 行 ， 通 过 thread: : panicking eA BOK FIT 
当前 工作 线程 是 人 否 由 于 发 生 您 眉 而 退出 ， 如 果 是 ， 则 将 panic_count 加 
1。 代 码 第 27 行 ， 同 样 调用 shared_data 的 no_work_notify all 方法， 来 通 
知 使 用 条 件 变量 的 wait 方 法 阻 暑 的 线程 在 线程 池 中 的 任务 执行 完毕 后 解 
除 阻 塞 。 代 码 第 28 行 ， 重 新 调用 spawn_in_pool 函 数 来 生成 工作 线程 。 

至 此 ， 线 程 池 实现 完毕 。 在 main 函 数 中 来 使 用 线程 池 ， 如 代码 清单 
11-54 所 示 。 

代码 清单 11-54:， 在 main 函 数 中 使 用 线程 池 


1. fn main() { 
Livy let pool = ThreadPool: :new(8) ; 
Sa let test count = Are: snew(Atomicusize: new (0) ) sz 
4. for dh Vaga 4 
D's Jet test eount = test. count..clone) ; 
6 pool.execute (move || { 
Ta best count.teten add (lle Ordering: :Relaxed) ; 
8 j); 
9 } 
Ls 入 入 
LE, assert egi (42,; test. count. load(Ordering: : Relaxed) ) 7 
lie 3 


ERE 11-54, ixctThreadPool: : new (8) 创建 了 拥有 8 个 
工作 线程 的 线程 池 ， 如 代码 第 2 行 所 示 。 

代码 第 3 行 ， 创 建 了 一 个 原子 类 型 的 变量 test_count， 用 于 计数 测 
me 
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test_count 加 1 的 任务 放 到 线程 池 中 进行 计算 。 

代码 第 10 行 ， 使 用 pool 的 join 方法 阻 杜 main 主 线程 等 竺 线程 池 中 的 


任务 执行 完毕 。 

代码 第 11 行 ， 通 过 断言 判断 test_count 的 值 最 终 为 42。 

最 后 在 项 目 根 目录 下 执行 cargo run 命 令 ， 代 码 正常 编译 运行 。 通 过 
此 示例 ， 我 们 了 解 到 如 何 创 建 一 个 简单 的 线程 地 ， 同 时 也 对 Rust 标 准 库 
中 提供 的 多 线程 并 友 工 具有 了 进一步 的 深入 了 解 。 


11.2.9 使 用 Rayon 执 行 并 行 任 务 


Rayon 2! 是 一 个 第 三 方 包 ， 使 用 它 可 以 轻松 地 将 顺序 计算 转换 为 魏 
全 的 并 行 计 算 ， 并 且 保 证 无 数据 竞争 。Rayon 提 供 了 两 种 使 用 方法 : 

FET IA Nas o BN EJ LAJIT HÍT HIERA o 

:join 方法 ， 可 以 并 行 处 理 递 归 或 分 治 风 格 的 问题 。 

代码 清单 11-55 展 示 了 使 用 Rayon 的 并 行 迭 代 夫 。 

代码 清单 11-55: 使 用 Rayon 的 并 行 欠 代 器 


lL. extern crate rayon; 

2. use rayon::prelude::*; 

3s In Sum of squares (tmput: &li3gzi]) => 142 1 
4. Input .Bar iter ().map(|)e1.| 1 * 1).. SOL() 
sn =f 

6. tin. increment allianputy met [T32]} 4 

Ts Input par Iter mut()«for eacn( |p| =p FS I); 
Ba gl 

a £n Main() f 

LU a let v = [1,2,3,4,5,6,7,8,9,10]; 

Ls let r = sum of squares (sY); 

LAs Pers tet £28 

LD 。 let mut v = [1,2,3,4,5,6,7,8,9,10]; 

14. imerement. BLL (emut wv); 

] LN 

Los d 


在 代码 清单 11-55 中 ， 人 代码 第 1 行 和 第 2 行 ， 分 别 引 入 了 rayon 包 和 
prelude ik. (RI 3~5íT, Æ X I sum_of_squares žk, HF HE] 


pariter tzr, I& (asi ze Rayon jE EMTA Ek EA 
AN FY AB ASE AT IA TR ABR 。 
代码 第 6 一 8 行 ， 定 义 了 increment all 函数 ， 其 中 使 用 了 par iter_mnut 
迭代 右 ， 这 是 Rayon 提 供 的 可 变 并 行 迭 代 器 。 
Emaint, Ay Hl Val Y sum_of_squares#llincrement_allPki2%, i 
终 和 输出 结果 如 代码 清单 11-56 所 示 。 
代码 清单 11-56: FRIAR aS ah 2G FR 
335 
I 9; 2r Sy Be dr Be Bae Lie L1] 
代码 清单 11-57 展 示 了 使 用 join 方法 进行 并 行 迭 代 。 
代码 清单 11-57: 使 用 join 方 法 进行 并 行 迭 代 


1. extern crate rayon; 

区。 二， 本 

Lt i & 2 4 下 me } 

4. let (a, BY = rayon:: join ( 
Fa || Sibis = 3j; 11 EiB = 2) 
6. ) ; 

Ta A $ D 

Bis } 

9 . fn main() { 

10. leG £ = £15(32) 7 

Ll: assert egi (ry, 2178309}; 
LB ,| 


在 代码 清单 11-57 中 ， 人 代码 第 2 一 8 行 实现 的 他 函数 用 来 计算 指定 位 
置 的 碍 疲 那 契 序 列 值 ， 在 广 函 数 中 使 用 rayon: : join 方法 接收 两 个 财 包 
开行 执行 ， 迭 代 过 程 如 图 11-11 所 示 。 





图 11-11: (8 A joim D AHAT th eee VA SE ee AB Be AME 

使 用 join 方法 并 不 一 定 会 保证 并 行 执行 用 包 ，Rayon 撒 层 使 用 线程 池 
来 执行 任务 ， 如 果 工 作 线 程 被 占用 ，Rayon 会 选择 顺序 执行 。Rayon 的 
并 行 能 力 基 于 一 种 叫 作 工作 窃取 CWorrk-Stealing) 的 技术 ， 线 程 池 中 
的 每 个 线程 都 有 一 个 互 不 影响 的 任务 队列 《〈 双 端 队列 ) ， 线 程 每 次 都 从 
当前 任务 队列 的 头 部 取出 一 个 任务 来 执行 。 如 有 果 寺 个 线程 对 应 的 队列 已 
空 并 且 处 于 空闲 状态 ， 而 其 他 线程 的 队列 中 还 有 任务 需要 处 理 ， 但 是 议 
线程 处 于 工作 状态 ， 那 么 空 用 的 线程 就 可 以 从 其 他 线程 的 队列 尾部 取 一 
个 任务 来 执行 。 这 种 行为 表现 就 像 空 用 的 线程 去 偷 工 作 中 的 线程 任务 一 
rE, POPU VES LEBER”. 

关于 Rayon 的 更 多 细节 ， 可 以 参考 其 源 公 中 rayon-demo 目 录 下 的 示 
例 。 


11.2.10 使 用 Crossbeam 


Crossbeam 是 比较 常用 的 第 三 方 并 发 库 ， 在 实际 开发 中 通 负 用 它 来 
代 伍 标准 库 。 它 是 对 标准 库 的 扩展 和 包装， 一 共 包 含 四 大 模块 。 
用 于 增强 std: : sync 的 原子 类 型 。 提 供 了 C++1l 风格 的 
Consume 内 存 顺 序 原 子 类 型 AtomicConsume 和 用 于 存储 和 检索 Arc 的 
ArcCell. 


- 对 标准 库 thread 和 各 种 同步 原 语 的 扩展 ， 提 供 了 很 多 实用 的 工具 。 
比如 Scoped 线 程 、 文 持 绥 存 行 填 宛 的 CachePadded 等 。 

提供 了 MPMC 的 Channel， 以 及 各 种 无 锁 并 及 数 据 结 构 。 包 括 : 并 
及 工作 神 取 双 问 队列、 并 有 无 锁 队 列 (MS-Queue) 和 无 锁 栈 〈Treiber 
Stack) 。 

提供 了 并 友 数 据 结 构 中 需要 的 内 存 管 理 组 件 crossbeam-epoch 。 

为 在 多 线程 并 发 情况 下 ， 如 果 线 程 从 并 发 数据 结构 中 删除 条 个 节点 ， 但 
是 该 和 点 还 有 可 能 被 其 他 线程 使 用 ， 则 无 法 立即 销毁 该 和 点。Epoch GC 
允许 推 运 销毁， 直到 和 它 变 得 安全 。 在 不 久 的 将 来 ， 其 还 将 文 持 险 象 指针 
(Hazard Pointer, HP) 和 QSBR (Quiescent-State-Based Reclamation) 
回收 算法 。 

扩展 原子 类 型 

Crossbeamf‘Jcrossbeam-utils fF fete S AtomicConsume trait, 7 
对 标准 库 中 原子 类 型 内 存 顺 序 的 增强 。 访 trait 允许 原子 类 型 
以 “Consume” 内 存 顺 序 进行 读 取 。“Consume” 内 和 存 顺 序 是 C++ 中 文 持 的 一 
种 内 存 顺 序 ， 可 以 称 为 消耗 -释放 顺 友 。 相 对 于 获取 -释放 顺序 而 言 ， 消 
耗 -释放 有 顺 订 的 性 能 更 好 。 因 为 获取 -释放 顺 订 会 同步 所 有 与 操作 之 前 的 
该 操作 ， 而 消耗 -释放 顺序 则 只 会 同步 数据 之 间 有 相互 依赖 的 操作 ， 粒 
上 度 更 细 ， 上 所 以 性 能 更 好 。 目 前 仅 ARM 和 AArch64 架 构 支 持 ， 在 其 他 架 
构 上 还 是 要 回归 到 获取 -释放 顺 厅 。 

通过 crossbeam-utils 包 ， 已 经 为 标准 库 std: : sync: : atomic 中 的 
AtomicBool、AtomicUsize 等 原子 类 型 实现 了 该 trait， 只 需要 调用 
load_consume 方 法 就 可 以 使 用 该 内 存 顺 序 。 


在 最 新 的 crossbeam-utils 包 中 ， 还 增加 了 一 个 原子 类 型 
AtomicCell， 其 等 价 于 一 个 具有 原子 操作 的 Cell 二 TT 二 类 型 。 
使 用 Scoped 线 程 


在 标准 库 线 程 生 成 的 子 线 程 中 ， 无 法 安全 地 使 用 父 线 程 中 的 引用 ， 
如 代码 清单 11-58 所 示 。 
代码 清单 11-58: 父 线 程 中 的 引用 无 法 在 子 线 程 中 安全 地 使 用 


1. fn maing) { 
Ea bet array = [iy Cr 2)? 
K let mut guards = vec![]; 
4. for &1 in &array { 
oe let guard = std::thread::spawn(move || { 
6. printin! ("elements {}", I)? 
Ta } ) 7 
8. guards.push (guard) ; 
9 } 
LY E for guard in guards 4 
ii guard.join().unwrap(); 
下 a } 
lós J 


在 代码 清单 11-58 中 ， 在 for 循 环 中 需要 使 用 &i 来 解构 引用 得 到 数组 
中 的 值 ， 才 能 在 子 线程 中 航 安 全 地 使 用 。 也 束 是 说 ， 在 子 线程 中 无 读 完 
全 地 使 用 父 线程 中 的 引用 。 

Crossbeam 提 供 了 一 种 Scoped 线 程 ， 人 允许 子 线程 可 以 安全 地 使 用 父 
线程 中 的 引用 ， 如 代码 清单 11-59 所 示 。 

代码 清单 11-59: 使 用 Crossbeam 提 供 的 Scoped 线 程 

// extern crate crossbeam; 

use crossbeam:: thread: :scope; 

fn main() { 


let array = [1, 2, 3]; 


il 

2 

3 

4 

De scope(|scope| { 
6 for 1 in éarray i 

7 scope.spawn(move || { println! ("element: {}", i)}); 
8 } 

9 


. }); 
Ll 了 

在 代码 清单 11-59 中 ， 代 码 第 工行 在 Rust 2018 版 本 中 可 以 省 略 。 
使 用 crossbeam: : thread: : scope 图 数 允 许 传 入 一 个 以 scope 为 参数 的 
闭 包 ， 在 该 财 包 中 由 scope 参 数 来 生成 子 线程 ， 其 可 以 安全 地 使 用 父 线 
Fe Cmain 主 线程) 中 array 数 组 的 元 素 引 用 。 


Seip, HEF Hy scope atc — > A as AS WY Scope ty (A, 145 
构 体 会 负责 子 线程 的 创建 、join 父 线程 和 析 构 等 工作 ， 以 便 保 证 引用 的 
2 

使 用 缓存 行 填 宛 提升 并 及 性 能 

在 并 及 编程 中 ， 有 一 个 亏 称 "无声 性 能 杀手 ”的 概念 叫 作伪 共 孚 
(False Sharing) 。 为 了 提升 性 能 ， 现 代 CPU 都 有 目 己 的 多 级 缓存 。 而 
在 绥 存 系统 中 ， 都 是 以 缓存 行 (Cache Line) 为 基本 单位 进行 存储 的 ， 
其 长 度 通 种 是 64 字 节 。 当 程序 中 的 数据 存储 在 役 此 相 邻 的 连续 内 存 中 
IT, FY LAM L1 级 缓存 一 次 加 载 完成 ， 且 受 缓存 市 来 的 性 能 极致 。 当 数 
据 结构 中 的 数据 存储 在 非 连 续 内 存 中 时 ， 则 会 出 现 绥 存 未 命中 的 情况 。 

将 数据 存储 在 连续 紧凑 的 内 存 中 虽然 可 以 调 来 高 性 能 ， 但 是 将 其 置 
于 多 线程 下 殉 会 发生 问题 。 多 线程 操作 同一 个 缓存 行 的 不 同 字 节 ， 将 会 
产生 芜 争 ， 导 致 线程 彼此 替 连 ， 相 互 影 响 ， 最 终 变 成 串 行 的 程序 ， 降 低 
了 并 发 性 ， 这 就是 所 谓 的 伪 共 至 。 因 此 ， 为 了 避免 伪 共 至 ， 束 需要 将 多 
线程 之 则 的 数据 进行 隔离 ， 使 得 它们 不 在 同一 个 缓存 行 ， 从 而 提升 多 线 
程 的 并 发 性 能 。 

避免 伪 共 至 的 方案 有 很 多 ， 其 中 一 种 方案 束 是 刻意 增 大 元 系 间 的 间 
隔 ， 使 得 不 同 线程 的 存 取 单 元 位 于 不 同 的 绥 存 行 。Crossbeam 提 供 了 
CachePadded< 工 > 类 型 ， 可 以 进行 缓存 行 需 序 (Padding) ， 从 而 避免 
TAFE 

在 Crossbeam 提 供 的 并 发 数据 结构 中 束 用 到 了 了 绥 存 行 填 充 。 比 如 并 
发 的 工作 窃取 双 端 队列 crossbeam-deque， 就 用 到 了 绥 存 行 填充 来 避免 伪 
共 孚 ， 提 升 并 友 性 能 。 

使 用 MPMC Channel 

Crossbeam 还 提供 了 一 个 std: : sync: : mpsc 的 蔡 代 品 MPMC 
Channel， 也 残 是 多 生产 者 多 消费 者 通道 。 标 准 库 mpsc 中 的 Sender 和 
Receiver “都 没有 实现 Sync， 但 是 Crossbeam 提 供 的 MPMC ”Channel 的 
Sender 和 Receiver 都 实现 了 Sync。 

所 以 ， 可 以 通过 引用 来 共享 Sender 和 Receiver。 代 码 清 单 11-60 展 示 
了 使 用 Crossbeam 提 供 的 MPMC Channel. 

代码 清单 11-60: 使 用 Crossbeam 提 供 的 MPMC Channel 


1. use crossbeam::channel as channel; 
Zs Fn Maamt) 4 

cP let (s, r) = channel: :unbounded() ; 
4. crossbeam::scope(|scope| { 

z% scope.spawn(|| { 

6. s.send(1); 

7. r.recv().unwrap() ; 

Bia } ) 7 

9 . scope.spawn(|| { 

I0 s.send(2); 

Tia r.recv().unwrap(); 

Lz ss b)e 

la. T)? 


代码 清单 11-60 基 于 Rust 2018， 上 所 以 省 略 了 extern crate crossbeam- 
WES 28347, (unbounded BOR GAC FMI ==. Crossbeamiett yy 
MPMC Channel 和 标准 库 的 Channel 关 似 ， 也 提供 了 无 界 通道 和 有 界 通 
TE, 两 种 类 型 。 

接 下 来 ， 使 用 scope 孙 数 创建 了 两 个 Scoped 子 线程 ， 并 退 过 获取 通 
TEL AC IH ims AT FAC hae HY S| FA RE SEE H Channel. “447%, th Ay Daw 
clone D YER FES TALE PA Yri o 

在 Crossbeam 中 还 提供 了 select! 宏 ， 用 于 方便 地 处 理 一 组 通道 中 的 
WAS, QS 11-61 PTA. 

代码 清单 11-61: 使 用 Crossbeam 提 供 的 select! 安 


use erossbeam Channels: select; 
use crossbeam channel as channel; 
use Soy; Loreac? 
tn Libsonace. í 
fib: channel::Sender<u64>, quit: channel::Receiver<()> 


) { 


SO: wd Oo Oo & GC ho Fe 


let imut wr MUE V) = (Us Lys 
loop { 
= select! { 
LU s send (fib, x) => { 
dia let tmp = x; 
Le x = y; 
J v= EMD + y? 
14. } 
Ta recv (quit) => { 
Le. Cranes (au Jp 
lesa return; 
LS 村 } 
19., } 
20. } 
2 ad 
LAs Li Malmi 4 
AS s Let (fab s, fib r) = ehannel:sbounded (0); 
24. ler (oui Be guit rj = channel: bounded (0) ; 
25% thread::spawn(move || { 
AG. EOE — AD Usa A 
Od 4 printlnl fib r.reew() .wnweap() ) 7 
29 « } 
2J; Git Bom? 
3G. plg 
BL 4 fibonacci.(fib sy quit x); 
Sha J 


(RI 11-614 FRust 2018， 上 所 以 不 需要 显 式 使 用 夫 [macro_use] 
来 导入 select! 宏 。 在 代 人 码 清 单 11-61 中 定义 了 fibonacci 函 数 ， 用 于 从 fib 


MERR SE ASB], FE MA quit FA Ha th. 

代码 第 8 一 20 行 ， 将 select! ZA Floop F, ÆA select! 宏 每 
次 只 会 执行 一 个 操作 。 对 于 select! 宏 来 说 ， 如 果 同 时 有 多 个 操作 已 经 
准备 就 绕 ， 则 会 随机 选择 一 个 执行 ， 否 则 ， 只 选择 最 先 准 备 束 绪 的 那个 
操作 来 执行 。 

在 main 函 数 中 ， 创 建 了 两 个 有 界 通 道 ， 如 代码 第 23 行 和 第 24 行 所 
示 。 但 这 两 个 有 界 通道 是 一 种 比较 特殊 的 通道 ， 在 Crossbeam 中 叫 作 才 
容量 通道 。 这 种 通道 会 一 二 阻 星 ， 除 非 接收 咒 可 以 对 其 进行 操作 。 

代码 第 25 行 ， 使 用 标准 库 线 程 生成 一 个 子 线程 。 

代码 第 26 一 28 行 ， 在 子 线程 中 通过 for 循 环 来 接收 fib_r 收 到 的 前 10 个 
斐 波 那 契 数列 。 代 码 第 29 行 ， 在 for 循 环 执行 完毕 后 ， 束 通过 quit_s 发 送 
消息 让 fibonacci 函 数 退 出 。 所 以 ， 在 for 循环 过 程 中 ， 在 fibonacci 函数 
的 select! 安 中 只 有 send HVE AWA, ATLL fibonacci 函 数 不 需要 担心 
突然 收 到 quit 消 息 而 意外 退出 。 只 有 当 for 循 环 结束 以 后 ，select! APY 
recv 操 作 才 会 执行 。 

其 实在 标准 库 std: : sync: : mpsc 模块 中 也 提供 了 Select 类 型 ， 
但 目前 还 是 实验 特性 。Crossbeam 提 供 的 select! 宏 还 有 很 多 其 他 功能 ， 
具体 可 以 查看 相关 文档 。 


11.3 异步 并 发 


在 本 和 章 开 头 的 “通用 概念 ”中 已 经 介绍 了 异步 并 发 相关 背景 ， 了 解 到 
异步 编程 的 发 展 一 共 经 历 了 三 个 阶段 。 第 一 个 阶段 ”， 下 接 使 用 回调 函 
数 ， 随 之 市 来 的 问题 是 “回调 地 狱 "?， 第 二 个 阶段 ， 使 用 Promise/Future 
并 发 模型 ， 解 决 了 回调 函数 的 问题 ， 但 是 代码 依旧 有 很 多 见 余 ;， 第 三 个 
阶段 ”， 利 用 协 程 实 现 async/await 解 决 方案 ， 也 写 称 “异步 的 终极 解决 方 
ze” 

目前 ， 很 多 编程 语言 都 文 持 异步 并 有 友 ， 但 并 非 都 文 持 到 第 三 个 阶 
段 。 比 如 异步 开发 大 放 异 彩 的 JavaScript 语 言 ， 也 只 是 在 ES 7 中 刚刚 支 
持 。 虽 然 各 种 语言 对 异步 编程 时 文 持 参 丢 不 齐 ， 但 异步 编程 解雇 方案 
async/await 几 乎 已 经 成 为 业界 的 事实 标准 。 然 而 ， 在 Rust ”1.0 正 式 发 布 
时 ，Rust 并 没有 包含 任何 异步 开发 的 文 持 。 这 和 古 因为 Rust 有 目 己 的 发 展 
路 线 ， 它 的 自 要 目标 是 解决 并 发 安全 有 的 问题 。 

在 经 过 一 系列 版 本 欠 代 之 后 ，Rust 才 确定 了 新 的 发 展 路 线 ， 即 : 成 
为 能 开发 出 高 性 能 网 络 服务 的 首选 语言 。 因 此 ，Rnust 31A SBA, be 
之 又 先后 引入 了 Future 并 发 模型 和 async/await 方 案 。 然 而 ， 引 入 异步 3 
及 模型 的 过 程 并 非 一 帆 风 顺 ， 本 来 计划 在 Rust 2018 稳 定 版 中 包含 
async/await 语 法 ， 但 最 后 因为 这 样 那 样 的 问题 不 得 不 延期 。 主 要 原因 是 
AE ee ef th se Ft Rusty se Ft ACA A A oe WE PA HT, (Ets 
现 了 Rust 退 求 安全 、 人 性 能 和 并 发 三 连 击 的 决心 。 


11.3.1 生成 器 


如 果 要 文 持 ”asyncawait 异步 开 友 ， 最 好 是 能 有 协 程 的 支持 。 所 
bh, Rust 的 第 一 步 是 需要 引进 协 程 CCoroutine) . 

协 程 的 实现 一 般 分 为 两 种 ， 其 中 一 种 是 有 栈 协 程 (Stackful) ; 5 
一 种 是 无 栈 协 程 (Stackless)  。 对 于 有 栈 协 程 的 实现 ， 一 般 每 个 协 程 
都 日 市 独立 的 栈 ， 功 能 强大 ， 但 是 比较 耗 内 存 ， 性 能 不 如 无 栈 协 程 。 而 
无 栈 协 程 一 般 是 基于 状态 机 (State Machine) 来 实现 的 ， 不 使 用 独立 
的 栈 ， 其 体 的 应 用 形式 叫 生成 占 (Generator) » HILENAES ”6 和 和 


Pythonia A PLF MERA. UBS PE ne ae, Ie Be 5g 
有 栈 协 程 ， 但 也 够 用 了 。 在 Rust 标 准 库 中 支持 的 协 程 功能 ， 就 属于 无 栈 
协 程 。 

什么 是 生成 器 

我 们 先 通 过 一 个 示例 来 了 解 Rust 中 生成 右 的 用 法 ， 如 代码 清单 11-62 
HIZR o 

代码 清单 11-62: Rust 生 成 器 的 用 法 


L. wt (feature (generators, generator trait) | 


2. use std::ops::Generator; 

S» fn maint) 

da let mut gen = ||{ 

Bs yield 1; 

Si yield 2; 

Ts yield 3; 

8. return 4; 

9. }; 

LO) i. unsafe { 

LI y for in Used 

lf; let c = gen.resume(); 
13. pPrancinlh i TFT g) 2 
14. } 

LB } 

löse j 


在 代码 清早 11-62 中 ， 代 码 第 1 行使 用 了 #! [feature (generators, 
generator_trait) ] 特性 ， 这 是 因为 Rust 中 提供 的 生成 器 功能 目前 属于 实 
验 性 功能 ， 还 未 稳定 。 

代码 第 2 行 ， 引 入 了 std: : ops 模 块 中 的 Generator trait. trait X 
了 生成 右 的 行为 。 

代码 第 4 一 9 行 ， 创 建 了 一 个 Generator， 从 形式 上 看 像 财 包 ， 但 它 不 
是 闭 包 ， 而 是 生成 器 。 其 中 的 yield 是 专门 为 生成 器 引入 的 关键 字 。 需 
要 注意 ， 生 成 器 不 能 像 财 包 那 样 接收 参数 。 

代码 第 10 行 ， 使 用 了 unsafe 块 ， 因 为 接 下 来 需要 调用 unsafe 的 resume 


方法 。 在 for 循 环 中 ， 调 用 4 次 resume 方 法 。 该 方法 会 让 程序 的 执行 流程 
Dk BAER AS PHT RAS, FFA Ee Slyieldse he SN DEH AAAs, 2 el 
AWHA. AE BAS A ie Oo A 11-12F 


resume() 


resume() 





图 11-12: 生成 颖 的 执行 流程 
在 图 11-12 中 展示 了 yield 和 resume 的 跳 转 过 程 。 第 一 次 调用 resume 方 
法 ， 跳 到 生成 右 中 ， 执 行 到 “yield 1”， 跳 回 到 调用 者 。 第 二 次 调用 
resume 方 法 ， 同 样 会 跳 到 生成 锅 中 ， 然 后 继续 从 上 次 的 "yield 1 位置 开 
始 执 行 代 人 码 ， 和 直到 过 到 “yield 2”, AHAHAHA. KEKE, BBA 
成 磺 代 人 码 执行 完毕 ， 到 达 return 那 里 。 
生成 需 使 用 yield 来 设置 状 在， 然后 通过 调用 resume 方 法 来 达到 状态 
的 流转 。 在 代码 清单 11-62 中 ， 状 态 从 和 初始 状态 0 一 直流 转 到 状态 4。 整 
个 生成 需 实 际 上 就 是 一 个 状态 机 。 输 出 结果 如 代码 请 单 11-63 所 示 。 
代码 清单 11-63: 输出 结果 
Yielded ( 
Yielded ( 
Yielded ( 
Complete 


该 输出 结果 并 非 像 图 11-12 9 Pr AEE fa BR AREA IR AS. IK 
回 的 结果 实际 上 是 一 种 枚 举 类 型 GeneratorState<.Y, R>, iZRWRA 


1) 
2) 
3) 
(4) 


括 Yielded (CY) 和 Complete (R) 两 种 值 。 其 中 Yielded (Y) 表示 在 生 
成 厚 执 行 过 程 中 产生 的 各 种 状态 ， 也 束 是 程序 在 生成 硕 代 但 中 挂 起 的 位 
fa; 而 Complete (R) 表示 生成 桥 执 行 完 成 后 最 终 返 回 的 值 。 

生成 占有 的 实现 原理 

在 Rust 中 Generator 被 定义 为 一 个 trait， 如 代码 清单 11-64 所 示 。 

代码 清单 11-64: Generator trait 源 人 码 


1 pub trait Generator { 

2 type Yield; 

3 type Return; 

4. unsafe fn resume(&mut self) -> 

5 GeneratorState<Self::Yield, Self::Return>; 
6 } 


在 代码 清单 11-64 中 ，Generator 包 含 了 两 种 天 联 类 型 ， 即 Yield 和 和 
Return， 分 别 对 应 于 yield 的 状态 类 型 和 生成 器 执行 完成 后 最 终 返 回 的 类 
型 。 

生成 器 语法 像 闭 包 ， 其 实现 原理 也 和 闭 包 类 似 。 比 如 在 代码 清单 
11-62 中 定义 的 生成 右 gen， 将 会 由 编译 器 上 自动 生成 一 个 匿名 的 枚 举 体 ， 
然后 为 该 枚 举 体 自动 实现 Generator。 等 价 代 码 如 代码 清单 11-65 所 示 。 

代码 清单 11-65: 代码 清单 11-62 中 生成 器 实例 gen 的 等 价 生 成 代码 


ON nD UO BWDN FE 


#! [feature (generators, 


use std::ops::{Generator, 


enum _ Gen { 
Star, 
Statel (Statel), 
State2 (State2), 
State3 (State3), 


generator trait) ] 
GeneratorState}; 


Done 


} 


Struct Statei { x: 
StrUucE StateZ { x: 
Struct States f x: 


u64 } 
u64 } 
u64 } 


impl Generator for _ Gen { 


type Yield = 
type Return = 
unsafe fn resume (&mut self) 


u64; 
u64; 


-> GeneratorState<u6o4, 


match stds:mem::replace(self,  Gens:::Done) 
_ Gen:: Start=> { 
"seGlt = Gens :Statel (Statel{x: 


} 


__Gen: :State2 (State2{x: 


} 


GeneratorState: :Yielded(l1) 


Gen: :Statel (Statel{x: 1}) => { 
*self = Gen: :Statez (Statezix: 
GeneratorState: :Yielded (2) 


ay) => ¥ 
*self = Gen: :States (State3s{x: 
GeneratorState: :Yielded (3) 


Gen: :State3 (State3{x: 
*self = 


GeneratorState: :Complete (4) 


arp =e 4 
__Gen: : Done; 


=> { 


} 


fn main() { 


let mut gen = 
in 0..4 { 
printlint ("{: 2)", 


ror 


} 


panic! ("generator resumed after completion") 


Gens: Start; 


1}); 


2})7 


3}); 


unsafe{ gen.resume()}); 


ARIYA Fe 11-65 中 ， 使 用 了 #1! [feature (generators, 
generator_trait) ] 特性 ， 这 古 因 为 Generator 目 前 古 未 稳定 的 特性 ， 所 以 
必须 在 Nightly 版 本 下 执行 该 代码。 

首先 ， 编 详 右 会 生成 一 个 匿名 的 枚 淮 体 ， 这 里 用 _Gen 来 表示 。 
为 在 代码 清单 “11-62 中 ， 在 生成 左 实 例 gen 中 使 用 yield 和 return 天 键 字 一 
共 定 义 了 4 种 状态 ， 所 以 在 _Gen 中 也 包 侣 了 4 个 枚 举 值 ， 即 
Statel (Statel) 、State2 (State2) . Statel (State3) 、Done， 但 还 必须 
包含 一 个 初始 状态 Start， 如 代码 第 3 一 9 行 所 示 。 

除 Start 和 Done 之 外 ， 中 国 的 三 种 状态 需要 存储 状态 值 ， 分 别 用 三 个 
结构 体 State1、State2 和 State3 表 示 ， 如 代码 第 10 一 12 行 所 示 。 

从 代码 第 13 行 开始 ， 为 ” Gen 实现 Generator。 代 码 第 14 行 和 第 15 
行 ， 分 别 指定 关联 类 型 Yield 和 Return 为 u64 类 型 。 

代码 第 16 行 ， 实 现 unsafe 的 resume 方 法 。 在 resume 方 法 中 调用 
std: : mem: : replace 方 法 ， 传 入 &mnut selffl__Gen: : Done。 每 次 调 
用 replace 方 法 ， 都 会 将 self 的 值 蔡 换 为 Gen: : Done， 然 后 返回 答 换 前 
的 self 的 值 。 接 下 来 使 用 match 匹 配 replace 的 结果 ， 达 到 状态 转移 的 目 
的 。 

代码 第 18 行 的 match 分 文 _Gen: : Start， 代 表 replace 调 用 返回 了 
Gen: : Start。 那 么 驳 将 状态 转移 到 Statel, Hae self 的 值 修改 
为 Gen: : Statel (Statel{x: 1}) ， 并 返回 GeneratorState: : 

Yielded (1) 。 依 此 类 推 ， 调 用 一 次 resume 方 法 ， 其 内 部 的 self 的 状态 束 
会 转移 一 次 ， 直 到 结束 。 

在 main 国 数 中 ， 展 示 了 调用 过 程 。 定 义 了 可 变 绑 定 gen， 将 
_ Gen: : Start 作 为 初始 状态 ， 然 后 循环 4 次 ， 分 别 调用 4 次 resume 方 
法 。 最 终 的 输出 结果 和 代码 清单 11-63 相 同 。 

当然 ， 代 码 清单 11-65 只 是 一 个 简单 的 生成 需 模 拟 代 码 ， 目 的 在 于 
前 述 生 成 右 的 执行 原理 。 实 际 编 详 右 和 后 成 的 代 但 要 比 这 个 复杂 。 

AE Mas SIA TK as 

AE ae ese aS AAA —TSe. WRR RERE, MRD 
计算 的 结果 ， 则 可 以 将 Return 设 置 为 单元 类 型 ， 只 保留 Yield 的 类 型 ， 也 
Lz Generator< Yield=T, Return= () >, ASAE REREAD AIK 


Ras, Uo 11-66 a . 
代码 清单 11-66: J4 Æ RASA EIA TR as 


1 #! [feature(generators, generator trait) ] 

2 use std::ops::{Generator, GeneratorState}; 
3 pub fn up to() -> impl Generator<Yield = u64, Return = (> 4 
4 il 4 

ae let mut x = Ds 

6 Loop {4 

z Z is 13 

8 yield x; 

9 } 

tU, return (); 

Lis } 

i d 

i3. EN Magra) 4 

14. lec mut gen = up tol); 

13. unsafe { 

LO- E AM Ue LO 

ie match gen.resume() { 

13. GeneratorState::Yielded(i) => printin! ("{:?}", 1), 
19. _ => princln! ("Completed"), 

20. } 

a1 } 

ZZ } 

Ada d 


在 代码 清单 11-66 中 定义 了 up_ to 函数 ， 返 回 一 个 impl Generator < 
Yield=64, Return= () 之 类 型 。 注 意 ， 该 代码 要 选择 在 Rust 2018 或 者 最 
新 的 Nightly Rust 中 执行 ， 因 为 impl Trait 语法 是 在 Rust 2018 中 加 入 的 。 

在 up_to 函 数 中 ， 定 义 了 一 个 生成 器 实例 ， 在 该 生成 器 中 利用 loop 循 
环 ， 从 0 开始 ， 逐 渐 加 1， 生 成 自然 数 序列 。 

在 main 函 数 中 ， 调 用 up_ to 函数 ， 返 回 了 生成 需 实 例 绑 定 给 b， 注 意 
这 里 是 可 变 绑 定 。 然 后 在 unsafe 中 循环 调用 b 的 resume 方 法 ， 并 使 用 
match 对 其 结果 进行 死 配 ， 从 而 产生 了 迭代 的 效果 。 


(AAP ca YY PE Ae EGTA Ca SE te AAA a ee EI Pe BCP 
性 计算 ”， 它 避免 了 不 必要 的 计算 ， 只 有 在 每 次 需要 时 才 通 过 yield 来 产 
生 相 关 的 值 。 

FALE a a Ee Future 

RATE Beas TP ILE WR GR, AR ESE AIA Nas. OM 
果 反 过 来 ， 不 天 心 过 程 ， REAR, 则 可 以 将 Yield 设置 为 单元 类 
型 ， 只 保留 Return 的 类 型 ， 也 束 是 Generator<Yield= () ， 
Return=Result<T，E> 之 ， 生 成 部 了 束 可 以 化 映 为 Future， 如 代码 清单 11- 
67 所 示 。 

代码 清单 11-67: LAE paste {Future 
t! [feature (generators, generator trait) ] 
use std::ops::{Generator, GeneratorState}; 
fn up cotlintt: woe) => 
impl Generator<Yield = (), Return = Result<u64, ()>> 


move || { 


Pear = Tt Daa lime 4 


io worl oo OF E W NHN F 
一 一 


yield (); 

} 
LU 5 return Ok(limnitjz; 
Es } 
lfs J 
Lo. LA 站 人 
14. let limit = 2; 
Los let mut gen = up to(limit); 
Lis unsafe { 
i Pa ior J. 2p Uen LIne 
LB « match gen.resume() { 
Ley GeneratorState::Yielded(v) => 
pU; printin! ("resume {:?} : Pending", 1), 


2 GeneratorState: :Complete(v) => 


2A Printini (“resume {#7} % Ready", 1); 
23. } 


24. } 
2a } 
26, } 
在 代码 清单 11-67 中 定义 的 up_to 函 数 返回 了 impl Generator < 


Yield= () , Return=Result<u64, O >>238#. IM, ŒÆup_tok 2 
中 ， 对 应 地 ， 修 改 了 yield 和 return 的 值 。 

然后 在 main 函 数 中 ， 对 生成 缮 实例 gen 进 行 resume 循 坏 调 用 ， 对 得 
到 的 值 进行 四 配 ， 最 终 得 到 的 输出 结果 如 代码 清单 11-68 所 示 。 

代码 清单 11-68: 代码 清单 11-67 的 输出 结 


resume 0 : Pending 
resume 1 : Pending 
resume 2 : Ready 
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就 返回 Pending 。 一 旦 计算 完成 ， 束 返回 Ready 。 

Future 是 一 种 异步 并 发 模式 ， 它 实际 上 是 代理 模式 和 异步 开发 
的 混合 产物 。Future 是 对 “未 来 ”的 一 种 代理 凭证 ， 和 攒 舍 这 个 攒 证 可 以 异 
步 地 在 未 来 某 个 时 刻 得 到 确定 的 结果 ， 而 不 需要 同步 等 每 。 比 如 网 购 一 
件 商 品 ， 你 下 的 订单 瓯 可 以 被 看 作 是 一 种 Future 。 此 时 对 你 来 说 ， 订 单 
的 状态 是 Pending ， 你 下 单 后 承 可 以 去 做 其 他 事情 ， 并 不 需要 花 时 间 天 
注 商 品 从 下 单 到 肥 货 的 整个 流程 。 丙 家 看 见 订 单 ， 目 然 会 投 流 程 进行 发 
Bt, ERREAZ, TA ES OR BY ORF HL, TT BLAST AS SE 
成 Ready “”。 所 以 ， 人 整个 网 购 过 程 是 异步 的 ， 丝 坚 疫 有 耽误 你 的 日 贡生 
活 。 

然而 ， 严 格 来 说 ， 生 成 需 属 于 一 种 半 协 程 (Semi-Coroutine) 。 半 
协 程 是 一 种 特殊 的 且 能 力 较 弱 的 协 程 ， 它 只 能 在 生成 融和 调用 者 之 则 进 
行 跳 转 ， 而 不 能 在 生成 需 之 国 进 行 跳 转 。 上 所以， 要 想 文 持 完 整 时 异步 编 
程 ， 还 需要 在 生成 喜 的 基础 上 进一步 完善 Future 并 发 模式 。 


11.3.2 Future 并 发 模式 


在 实际 的 异步 开 及 中 ， 需 要 将 一 个 完整 的 功能 切 分 为 一 个 个 独立 的 
异步 任务 ， 并 且 这 些 任务 之 间 还 可 能 彼此 依 顿 ， 一 个 任务 的 输出 也 许 是 
夯 一 个 任务 的 输入 。 比 如 服务 硕 闪 处理 基 本 的 HTTP 请求， 承 可 以 分 解 
为 建立 连 撤 、 处 理 请 求 、 返 回 啊 应 这 三 步 。 如 果 将 每 一 步 都 抽象 为 一 个 
异步 计算 单元 ， 那 么 一 共 束 有 三 个 异步 计算 单元 ， 并 且 后 两 步 的 计算 都 
依赖 于 前 一 步 的 计算 结果 。 而 且 ， 每 一 个 异步 计算 单元 还 可 以 细 分 为 更 
小 的 异步 计算 组 合 。 如 果 想 要 合理 地 调度 和 高 效 地 计算 这 些 异 步 任务 ， 
融 需 要 一 个 完善 的 异步 系统 。 

因此 ，Rust 对 Future 寞 步 并 发 模式 做 了 一 个 完整 的 抽象 ， 包 含 在 第 
三 方 库 futures-rs 中 。 访 抽象 主要 包 合 三 个 部 件 : 

:Future ， 基 本 的 异步 计算 抽象 单元 。 

‘Executor, Fev it Riel. 

: Task ， 弄 步 计 算 执行 层 。 

当然 ，futures-rs 库 还 包含 其 他 部 件 ， 但 这 三 个 部 件 属于 核心 部 件 。 

Future 


在 Rust 中 ，Future 是 一 个 trait， 其 源码 如 代码 清单 11-69 所 示 。 
代码 清单 11-69: Future trait} i 15 

il pub trait Future { 

2 type Output; 

cP fn poll(self: Pin<&mut Self>, lw: &LocalWaker) 
4 -> POLI<ASSELTS tt 

3 } 


代码 清单 11-69 展 示 的 是 std: : future 模 块 中 Future trait 的 源码 LO! ， 
它 包含 了 用 于 指定 返回 类 型 的 关联 类 型 Output 和 poll 方 法 。 

其 中 poll 方法 是 Future 的 核心 ， 它 是 对 轮 询 行为 的 一 种 抽象 。 先 不 
用 管 参数 中 的 Pin 和 LocalWaker 凑 型， 后面 会 详细 介绍 。 在 Rust 中 ， 每 个 
Future 都 需要 使 用 poll 方 法 来 轮 询 所 要 计算 值 的 状态 。 设 方法 返回 的 Pol 
是 一 个 枚 举 类 型 ， 其 源码 如 代码 清单 11-70 所 示 。 

代码 清单 11-70: Po 天 工 > 类 型 源码 


1 pub enum Poll<T> { 
2 Ready (T), 

cP Pending, 

4 } 


从 代码 清单 11-70 中 可 以 看 出 ，Poll<T> 枚 举 类 型 包含 了 两 个 枚 举 
B>; BH Ready (CT) 和 Pending . 1%24! 4 Option<T>. Result<T, E 
> 相似， 都 属于 和 类 型 。 它 是 对 准备 好 ”和 未 完成 ”两 种 状态 的 统一 抽 
象 ， 以 此 来 表达 Future 的 结果 。 对 于 每 个 Future 来 说 ， 无 非 束 是 这 两 种 
结果 。 

Executor 和 Task 

Future 只 是 一 个 基本 的 异步 计算 抽象 单元 ， 有 其 体 的 计算 工作 还 需要 
由 Executor 和 Task 共 同 完成 。 

在 实际 的 卉 步 开 及 中 ， 会 遇 到 纷 党 复杂 的 弄 步 任 务 ， 还 需要 一 个 专 
门 的 调度 喜来 对 具体 的 任务 进行 管理 统筹 ， 这 个 工具 束 是 Executor。 县 
体 的 异步 任务 就 是 Task。 拿 futures-rs A 来 说 ，Executor 是 基于 线程 池 实 
现 的 ， 其 工作 机 制 如 图 11-13 所 示 。 

第 三 方 库 futures-rs 是 由 很 多 小 的 crate 组 合 而 成 的 ， 其 中 futures- 
executor 库 专门 基于 线程 池 实 现 了 一 僚 Executor。 

图 11-13 上 半 部 分 ， 展 示 了 几 个 关键 的 复合 关 型 : ThreadPool、 
PoolState、Message 和 Task。 注 意 ， 此 处 复合 类 型 中 的 字段 或 枚 举 值 涉 
及 的 其 体 类 型 ， 为 演示 而 做 了 人 简化， 和 实际 代码 中 的 有 所 差异 。 


struct ThreadPool| |struct PoolState| | enum Message struct Task 


tx: SendereMessage> Runl Task) future: FutureObj 


state: Arc<PoolState> 
rx: Receiver<Hessage> Close wake_handle: Arc<WakeHandle> 


Thread Pool} ——> new ————> poolstate, work => task. run 


| PoolState: rx.recy() 


spawn_ob] 


| 
PoolState: tx.send( Message::Run(task) | 


futures: :mpsc::channel f poll: :Pending 


PoolState: tx.send( Message: :Runltask) ) 





图 11-13: futures-rs 库 的 Executor 和 Task 工 作 机 制 示 总 

ThreadPool 是 一 个 结构 体 ， 包 侣 了 一 个 字段 state， 设 置 为 Arc<< 
PoolState 之 关 型 ， 是 为 了 共 吾 线程 地 内 的 线程 信息 。 

PoolState 同样 是 一 个 结构 体 ， 包 含 了 tx 和 rx 两 个 字段 ， 分 别 是 
Sender < Message > #llReceiver< Message > 24! . IX PHS RRS 
std: : sync: : mpschebe E CA AI PChannelati 75 HY AIK tty A eC ing 
美 型 相似 ， 但 实际 上 十 futures-channel 中 定义 的 类 型 。 而 区 和 IX 的 作用 是 
关 似 的 ， 同 样 用 于 Channel 通 信 。 

Message 是 一 个 枚 举 类 型 ， 包 含 了 两 个 枚 举 值 ， 其 中 了 最 重要 的 殉 是 
Run (Task) . i%Message H F AIS FI|Channel PAYA SH. ENE Ae 
含 两 种 可 能 ， 其 中 一 种 是 运行 Task; 男 一 种 是 天 闭 线程 池 。 

Task 是 一 个 结构 体 ， 包 含 了 future 和 wake_handle 两 个 字段 ， 分 别 
为 “FutureObj ”和 Arc 二 WeakHandle 二 > 类型。 顾名思义 ，FutureObj 束 古 
Future 对 象 ， 它 实际 上 是 futures-executor 中 实现 的 自 定 义 Future 对 象 ， 它 
是 对 一 个 Future trait 对 象 的 一 种 包装 ; 而 WeakHandle 则 是 用 来 唤醒 任务 
的 句柄 。 

图 11-13 下 半 部 分 ， 展 示 了 Executor 完 整 执行 流程 的 简单 示意 图 。 


Executor 提供 了 一 个 Channel ， 实 际 上 残 是 一 个 任务 队列 。 开 发 者 
可 以 通过 ThreadPool 提 供 的 spawn_obj 方法 将 一 个 异步 任务 (Task) 发 
送 (send) 到 Channel 中 。 实 际 上 ， 在 spawn_obj 内 部 是 通过 PoolState 结 
构 体 中 存储 的 发 送 端 tx Message: : Run (task) 发 送 到 Channel 中 
的 。 

通过 ThreadPool: : new 方法 ， 可 以 从 线程 池 中 调用 一 个 线程 来 执 
行 具体 的 任务 。 同 时 ， 在 该 线程 中 也 调用 了 PoolState 结 构 体 的 work 77 
法 来 消费 Channel 中 的 消息 。 实 际 上 ，work 方 法 是 通过 PoolState 结 构 体 
中 存储 的 接收 吴 rx 接收 并 消 引 Message: : Run (task) 的 。 

束 这 样 ， 由 spawn_obj 往 Channel 中 友 运 消 恩 ， 由 work 来 接收 并 消费 
消 恩 ， 构 成 一 个 完整 的 工作 流程 。 

当 work 方 法 接收 到 Message: : Run (task) 之 后 ， 会 调用 Task 中 
定义 的 run 方法 来 执行 具体 的 task。 在 run 方 法 中 ， 调 用 存储 于 task 实 例 
中 的 FutureObj 类 型 值 的 poll_unpin 方 法 ， 将 会 执行 具体 的 poll 方 法 ， 返 回 
Pending 和 Ready 两 种 状态 。 如 果 是 Pending 状 态 ， 则 通过 task 实 例 存 储 的 
WakeHandle 句 柄 将 此 任务 再 次 唤醒 ， 也 残 是 重新 将 该 任务 发 大 到 
Channel 中 ， 等 待 下 一 次 轮 询 ， 如 果 是 Ready 状 态 ， 则 计算 任务 完成 ， 返 
回 到 上 属 进 行 处 理 。 

以 上 就 是 整个 futures-rs 核 心 工 作 机 制 的 简要 概括 。 通 过 图 11-13， 我 
们 可 以 从 整体 上 把 握 并 建立 Rust 中 Future 异 步 开 发 的 心智 模型 。 


11.3.3 async/await 


迄今 为 止 ， 第 三 方 库 futures-rs 经 历 了 三 个 阶段 的 迭代 。 在 0.1 版 本 
中 ， 开 发 者 可 以 通过 then 和 and_then 方 法 来 安排 Future 寞 步 计 算 的 执行 顺 
序 。 但 是 经 过 一 段 时 间 的 用 户 反 馈 之 后 ， 发 现 这 种 方式 会 导致 很 多 混乱 
的 艇 僚 和 回调 链 ， 不 利于 人 体 工 程 学 。 于 古 就 引入 了 async/await 解决 
方案 。 义 经 过 两 个 阶段 的 重 构 ， 目 前 为 0.3 版 本 。 

代码 清单 11-71 展 示 了 futures-rs 先 后 提供 的 两 种 写法 对 比 。 

代码 清单 11-71: futures-rs 两 种 写法 对 比 


| 
2. £n download and write tweets ( 
3x users String, 
4. socket: Socket, 
<a ) -> impl Future<Output = 10::Result<()>> { 
Oa pull down tweets (user) 
ta sand then(move |tweets| write tweets (socket) ) 
oe d 
9. ff fuatures-re 0.3 
LO, asyne fn download. and write tweets ( 
Ts user: &str, 
Lie socket: &Socket, 
L3. + ~> 102: Result ti> {í 
14. let tweets = await! (pull down tweets (user) ) ?; 
Los await! (write tweets (socket) ) 
16%. 3 
在 代码 清单 11-71 中 ， 用 两 种 写法 定义 了 异步 函数 


download_and_write_tweets， 执 行 访 函数 ， 需 要 先 执行 pull_down_tweets 
措 步 函数 ， 再 执行 write_tweets 寞 步 水 数 。 可 以 看 出 ， 第 一 种 写法 使 用 
and_then 构 成 了 很 长 的 调用 和 链 ; 而 第 二 种 写法 使 用 async 关 键 字 和 await! 
宏 ， 在 语义 上 要 比 使 用 and_then 更 加 直观 和 精简 。 

Rust 当 前 以 async 关 键 字 配合 await! 宏 来 提供 async/await 异 步 开 发 方 
案 。 在 不 久 的 将 来 ，await 也 会 变 成 天 键 宁 。 

async/await 实 际 上 是 一 种 语法 糖 。async fn 会 目 动 为 开发 者 生成 返回 
值 是 impl Future 类 型 的 函数 。 束 像 代码 清单 11-71 中 第 二 种 写法 生成 的 代 
人 码 ， 实 际 上 等 价 于 第 一 种 写法 。 

async/await 实 现 原 理 


Rust 不 仅仅 文 持 使 用 async 全 定义 异步 六 数 ， 还 文 持 async 块 ， 如 代 
1y 11-72 AR. 
代码 清单 11-72: async 块 示意 


l. let my future = asyne | 

in await! (prev async func); 

3 printin! ("Hello from an async block"); 
te Jl 


在 代码 清单 11-72 中 ， 和 直接 使 用 async 块 来 创建 一 个 Future。 实 际 
上 上， 使 用 async fn 定义 函数 在 拘 层 也 是 由 async 块 来 生成 Future 的 。 图 11- 
14 展 示 了 这 个 过 程 。 


async] ——+ [Generator] ——» [Gerotore] — [inpt Future 


t + + 
keyword yield GenFuture<T: Generator<Yield = ()>>(T) 


async fn resune( ) impl Futre for GenFuture 


esync block poll 


resume() 





图 11-14: 由 async 块 生成 Future 过 程 示意 图 
如 图 11-14 所 示 ，async 关 键 字 无 论 是 用 来 定义 异步 函数 ， 还 是 定义 
异步 块 ， 在 Rust 将 代码 解析 为 AST 之 后 ， 在 HIR 层 都 会 转换 为 async 
块 的 形式 。 再 将 async 块 生 成 一 个 Generator< Yield= © 二 类 型 的 生成 
人 髓 来 使 用 。 然 后 将 该 生成 融通 过 时 元 结构 体 GenFuture 进 行 包装 ， 得 到 
一 个 GenFuture 二 T: Generator<Yield= O) >> (T) 类 型 ， 最 后 为 访 
GenFuture 实 现 Future， 如 代码 清单 11-73 所 示 。 


代 公 清单 11-73: ANGenFuture®< Pl Future} 63 


1. impl<T: Generator<Yield = ()>> Future for GenFuture<T> { 

i type Output = T::Return; 

ce fn poll(self: Pin<&mut Self>, lw: &LocalWaker) 

4 . LTGUT 

Da { 

bis set task waker (lw, | 

Ta mateh unsafe { Pin::get mut unchecked (self).0.resume() | 
ps { 

9. GeneratorState::Yielded(()) => Poll::Pending, 
Les GeneratorState::Complete(x) => Poll::Ready(x), 
Ll } 

12. ) 

Le » } 

14. } 


代码 清单 11-73 展 示 了 在 std: : future 模 块 中 为 GenFuture 实 现 Future 
的 源码 。 关 键 在 于 ， 在 poll 方 法 中 调用 了 resume 畏 数 。 此 处 的 Pin: 
get_mut_unchecked (self) 会 返回 一 个 &mnut self， 所 以 这 里 等 价 
于 “&mnut self.0.resume () ”。 通 过 匹配 resume 方 法 的 调用 结果 ， 来 轮 询 
Future 的 计算 结 末 。 这 和 在 代码 清单 11-67 中 用 生成 器 模拟 Future 很 相 
似 。 

接 下 来 ， 通 过 std: : future 模 块 中 的 from_generator 国 数 ， 将 实现 了 
Future 肘 GenFuture 作 为 返回 值 插 入 编译 器 生成 的 代码 中 。 

DA Ene async 语法 糖 在 编译 占 内 部 转化 作为 返回 类 型 GenFuture 
的 整个 过 程 。 当 然 ， 还 需要 await! 宏 相 互 配合 才 可 以 。await! Z JRI 
示意 网 如 图 11-15 所 示 。 


Loop 


if task::PoLL: :Ready 


break; 


else yield 





11-15: await! 宏 原理 示意 图 
await! 宏 必 须 在 async 欣 中 使 用 ， 不 能 单独 使 用 。 因 为 await! K 
际 展 开 的 代码 要 在 loop 循 环 中 对 轮 询 结果 进行 判断 。 如 果 是 Ready 状 
态 ， 则 跳出 loop 循 环 ) 如 果 是 Pending 状 态 ， 则 生成 yield。 正 因为 这 个 
yield， 才 人 允许 async 块 生成 一 个 Generator<Yield= O 二 类 型 的 生成 器 。 
Pin 与 UnPin 
在 前 面 的 示例 中 ， 多 次 出 现 Pin 类 型 ， 这 是 什么 意思 呢 ? Pin<T> 
实际 上 是 一 个 被 定 义 于 std: : pin 模块 中 的 智能 指针 。 它 是 在 Rust 2018 
版 本 中 新 增 的 语法 ， 经 过 多 次 迭代 之 后 ， 在 Rust 1.30 厂 本 中 和 定型 为 Pin 去 
T>e 
HA, KTA RECE? ERES 11-62 ”中 的 生成 器 实例 
gen， 如 果 换 种 写法 看 看 会 有 什么 问题 ， 如 代码 清单 11-74 所 示 。 
代码 清单 11-74: 修改 代码 清单 11-62 中 的 生成 需 实 例 
1. let mut gen = ||{ 
let x = 1u64; 
let ref x = &X; 
yield 1; 
yield 2; 
yield 3; 


return 4; 


0O =~] O FSF W NN 


FEASTS 11-747, AAR Ras SE DS PAS iT HY ASH E Be 
定 : XxX 和 ref x， 其 中 ref_ x 是 对 x 的 引用 。 修 改 成 这 样 ， 编 译 代 人 码 时 会 报 


TH: 


error[E0626]: borrow may still be in use when generator yields 
| let rel x = 《2X 


人 


possible yield occurs here 

该 错误 表示 Rust 不 允许 在 生成 器 中 使 用 对 本 地 变量 的 引用 ， 这 个 问 
题 与 生成 硕 实 现 原 理 有 关 。 

回顾 代码 清单 ”11-65。 生 成 融会 由 编译 右 生 成 相应 的 结构 体 来 记录 
状态 ， 当 生成 占 包 含 对 本 地 变量 的 引用 时 ， 访 结构 体会 生成 一 种 自 引 用 
结构 体 (Self-referential Struct)  。 人 代码 清单 11-75 展 示 了 代码 清单 11- 
74 中 生成 颖 实例 生成 代码 。 


代码 清单 11-75: 代码 清单 11-74 中 生成 副 实 例 生 成 代码 


la nüm Gen<'a> { 

Ling Start; 

Ja Statel (Statel<'a>), 

A. State2 (State2), 

Di State3 (State3), 

6s Done 

le J 

0. BERGE Statel<'’a> 4 i ee; Fert zi L'S 64 | 

3. <Jitpi<'a> Generator for  Gen<'a> | 

10 type Yield = u64; 

it type Return = u64; 

LZ unsafe fn resume(&mut self) -> GeneratorState<u64, u64> { 
La., nateh stidiimemssreplace(selt, Genrs:Done) 4 
Li, — Gens: Start => { 

1B x let x = 1; 

| let Stalel = sratelix: Re TET K: Sete 
is ‘self = Gens istatel (statel) ; 

站: 本 GeneratorState: : Yielded(1) 

La; } 

20 __ ‘GENS i SEALs! (Statel ize ly Fer Ss ELJI => 4 
21 self = Gen: States (Statez (x: zi): 
22. GeneratorState: : Yielded (2) 

25 } 

ZA, // .. .省 略 

AD s } 

28) x } 

Ala J 


在 代码 清单 11-75 中 ， 由 Statel 结 构 体 来 存储 生成 器 实例 中 对 本 地 变 
量 的 引用 ， 会 生成 一 个 目 引 用 结构 体 ， 如 代码 第 8 行 所 示 ， 该 结构 体 中 
字段 ref_x 的 值 是 对 字段 x 的 引用 。 

在 resume 函 数 中 ， 代 码 第 15 一 17 行 生成 一 个 自 引 用 结构 体 的 实 
例 。 在 resume 国 数 被 调用 时 ， 当 内 部 状态 从 Statel 转 移 到 State2， 也 残 是 
代码 第 20 行 所 示 的 match 分 文 执行 时 ， 说 明 replace 方 法 已 经 将 State1 蔡 换 


挥 了 。 

replace 方 法 本 质 上 十 移动 指针 的 内 存 位 置 ， 将 State1 蔡 换 为 State2。 
这 了 束 意 味 厦 ， 实 际 上 State1 的 所 有 权 已 经 有 故 生 了 转移 。State1 内 存 位 置 的 
改变 会 影响 到 字段 x 的 位 置 ， 而 这 时 其 内 部 的 字段 ref_ x 还 在 引用 字段 x 的 
值 ， 这 就 造成 了 悬垂 指针 。 这 是 Rust 绝 对 不 允许 发 生 的 事情 。 同 时 ， 这 
tH 7 AE as resume RR A tp iE unsafe h3 JE Al 。 

所 以 ， 为 了 避免 这 种 情况 ， 开 及 者 不 得 不 使 用 Box< 工 > 或 Arc<T 
二 等 手段 来 解决 此 问题 ， 这 束 造 成 了 性 能 上 的 损耗 。 而 生成 上 费 是 为 异步 
编程 服务 的 ，Rust 引 入 弄 步 编 程 的 目的 是 为 了 打造 高 性 能 服务 开发 的 首 
选 语言 。 现 在 因为 目 引 用 结构 体 的 问题 而 无 法 让 生成 右 的 性 能 发 挥 到 最 
大 化 ， 这 是 无 法 容忍 的 。 所 以 ，Rust 团队 必须 要 解决 这 个 问题 。 而 Pin 
<T> 类 型 束 是 解决 方案 。 

Pin 过 TT 二 实 际 上 是 一 个 包装 了 指针 类 型 的 结构 体 ， 其 中 指针 类 型 是 
指 实 现 了 Deref 的 类 型 。 下 面 我 们 通过 一 个 示例 来 了 解 Pin< 工 > 的 用 
法 ， 如 代码 清单 11-76 所 示 。 

代码 清单 11-76: Pin<T> HER BI 


1. #![feature (pin) ] 

2. use std::pin::{Pin, Unpin}; 

3. use std: :marker: :Pinned; 

4. use std::ptr::NonNull; 

5. struct Unmovable { 

Gs data: String; 

Tk slice: NonNull<String>, 

8. pim Pinned, 

a. 3 

10. impl Unpin for Unmovable {} 

11. impl Unmovable { 

l2 fn new(data: String) -> Pin<Box<Self>> { 

Ls let res = Unmovable 1 

14. data, 

二。 slice: NonNull::dangling(), 

LG. pin: Pinned, 

ile }; 

LS. let mut boxed = Box::pinned(res) ; 

1. let slice = NonNull::from(&boxed.data) ; 

20. unsafe { 

21. let mut ref: Pin<&mut Self> = Pin::as mut (&mut boxed); 
22% Pit: get mut unchecked (mut ref) .slice = slice; 
Z3 } 

24. boxed 

PASM } 

20. | 

27. fn main() { 

28. let unmoved = Unmovable::new("hello".to string()); 
29: let mut still unmoved = unmoved; 

30. assert eq! (still unmoved.slice, 

3L.. NonNull::from(&still unmoved.data)); 

32% let mut new unmoved = Unmovable::new("world".to string()); 
33 std::mem::swap(&mut *still unmoved, &mut *new unmoved) ; 


CoO 
a 


在 代码 清早 11-76 中 ， 代 码 第 1 行使 用 了 #! [feature (pin) ] 特 
性 ， 这 是 因为 目前 Pin<T > 还 是 实验 性 特性 。 

代码 第 2 行 ， 引 入 了 Pin 和 Unpin。 顾 名 思 义 ，Pin 有 “ 钉 ” 之 意 。 在 
Rust 中 ， 使 用 Pin<T> 则 代表 将 数据 的 内 存 位 置 牢 牢 地 *“ 钉 ?在 原 地 ， 不 
让 它 移 动 。Unpin 则 正好 和 Pin 相对 应 ， 代 表 人 被 “ 钉 ” 住 的 数据 ， 可 以 安 
全 地 移动 。 大 多 数 类 型 都 自动 实现 了 Unpin。 

代码 第 3 行 ， 引 入 了 Pinned， 这 是 一 个 用 于 标记 的 结构 体 ， 被 定义 
于 std: : marker 模 块 中 。 如 果 一 个 类 型 中 包含 了 Pinned， 则 意味 看 该 类 
型 将 不 会 默认 实现 Unpin， 但 不 影响 手动 实现 。 

代码 第 4 行 ， 引 入 了 NonNul<IT>， 这 是 为 了 创建 自 引 用 结构 体 而 
使 用 的 。 

代码 第 5 一 9 行 ， 定 义 了 一 个 目 引 用 结构 体 Unmovable， 它 包含 的 字 
段 slice 很 可 能 会 引用 data 字 段 。 另 外 ，Unmovable 还 包含 了 Pinned 字 段 ， 
表示 它 将 不 会 默认 实现 Unpin。 

代码 第 10 行 ， 手 动 为 Unmovable 实 现 Unpin。 

代码 第 11 一 26 行 ， 为 Unmovable 实 现 了 new 方 法 ， 它 返回 一 个 Pin 到 
Box<Self> 之 类 型 的 值 。 在 new 方 法 中 ， 首 先 创 建 了 一 个 Unmovable 实 
例 res， 然 后 使 用 Box: : pinned 方 法 将 res 生 成 Pin<Box<Unmovable> 
二 类 型 的 值 boxed， 再 利用 NonNull: : from 函 数 将 boxed 实 例 的 data 字 段 
转换 为 NonNull 指针 绑 定 给 slice 变 和 量 。 接 下 来 ， 在 unsafe 块 中 ， 通 过 
Pin: : as_mnut 国 数 从 &mut boxed 得 到 一 个 Pin<&mut Self >X! KA 
mut_ref， 在 当前 代码 中 具体 类 型 为 Pn<&mut Unmovable>. mai 
Pin: : get_mut_unchecked 因数 引用 Pin<&mut Unmovable 之 中 的 &mnut 
Unmovable， 并 将 其 slice 字 段 的 值 赋值 为 slice 变 量 。 这 了 吏 创 建 了 一 个 目 
引用 结构 体 的 实例 。 

在 main 函 数 中 ， 使 用 new 方 法 创建 了 Unmovable 实 例 unmoved， 然 后 
将 其 赋值 给 新 的 变量 still unmoved， 目 的 是 想 要 转移 unmoved 的 所 有 
权 。 从 第 30 行 和 第 31 行 的 断言 代码 中 得 知 ， 访 结构 体 实 例 在 所 有 权 转 移 
之 后 ， 字 段 的 地 址 并 没有 改变 。slice 字 段 引 用 的 data 字 段 最 初 的 地 址 ， 
现在 断言 相等 ， 隋 证 明 data 字 段 的 地 址 没有 变 。Pin 过 工 > 类 型 起 作用 
ie 


Wes 32 行 和 第 33 行 ， 创 建 了 一 个 新 的 “Unmovable 实例 
new_unmoved， 使 用 std: : mem: : swap 来 交换 它 和 still unmoved 的 
引用 地 址 ， 正 间 通 过 。 这 是 因为 代码 第 10 ， 行为 Unmovable 实 现 了 
Unpin。 如 果 将 代码 第 10 行 注释 挥 ，swap 代 人 码 将 编译 失败 。 如 果 此 时 继 
续 将 Unmovable 的 Pinned 类 型 字段 注释 挥 ， 则 该 结构 体会 默认 实现 
Unpin，swap 代 人 码 将 正常 编 详 。 

现在 回顾 在 代码 清单 11-73 中 GenFuture 实 现 poll 方 法 时 ， 使 用 了 Pin 
<&mut Self 宝 ， 束 确保 该 类 型 了 好 终生 成 的 生成 可 不 会 出 现 因 为 自 引 用 结 
构 体 而 产生 未 定义 行为 的 情况 。 然 后 在 需要 时 使 用 Pin: : 
get_mut_unchecked ”函数 获取 其 包含 的 可 变 们 用 。Pin< 工 > 结构 体 也 包 
舍 了 很 多 其 他 函数 ， 谈 者 可 以 到 标准 库 文 档 中 目 行 租 看 。 

async/await 异 步 开 发 示例 

当前 ， 要 想 使 用 Rust 进 行 异 步 开 及， 需要 配合 使 用 标准 库 和 第 三 方 
futures-rs 库 。 这 是 因为 标准 库 中 引入 了 Future 和 Task 两 种 类 型 ， 是 为 了 
配合 实现 async/await 天 键 子 。 而 Future 的 大 部 分 功能 都 由 futures-rs 来 提 
供 ， 未 来 标准 库 和 futures-rs 库 可 能 会 有 所 变化 ， 但 是 大 体 的 原理 和 机 制 
基本 不 会 改变 ， 要 变 的 也 只 能 是 API。 

接 下 来 通过 一 个 有 具体 的 示例 来 回顾 Rust 异步 开发 。 使 用 cargo new 
命令 创建 一 个 新 的 crate， 命 名 为 "futures-demo”。 在 Cargo.toml 文 件 中 引 
入 第 三 方 库 futures-preview， 本 书 代 人 码 使 用 的 是 0.3.0-alpha.7 版 本 ， 然 后 
修改 main.rs 文 件 ， 如 代码 清单 11-77 所 示 。 

代码 清单 11-77: async/await 异 步 开 发 示例 


i “al © A gar tek BO pP 


WO 


= e PP 
心 w NEO» 


#! [feature (arbitrary self types, 


FUCUEES Api.) | 


#! [feature(async await, await macro, pin) ] 


use 


be 

use 
use 
use 
pub 


futLUres ?: +i 


executor::ThreadPool, 


task: :SpawnExt, 


std: : future: ¢i Future} ; 
Stas * bins £ Pits 

Stat: casks iy 

struct AlmostReady { 


ready: bool, 


value: 132, 


} 
pub 


fn almost. ready'(value: 132) 


-> AlmostReady { 


i.e AlmostReady { ready: false, value } 


loy ] 

17. impl Future for AlmostReady { 

Lös type Output = 132; 

Lo. fn poll(self: Pin<émut Self>, lw: &LocalWaker) -> 
20. Poll<Selfy : Output 

AR { 

22> if self.ready { 

23 s Poll: :Ready(self.value + 1) 

24. } else { 

An unsafe { Pinisoeh mut unchecked (selt) «ready = true 7} 
EASI lw.wake(); 

Cel a Poll: :Pending 

28. } 

29 } 

30. d 

21. TH aln) 4 

i2 s let mut executor = ThreadPool::new().unwrap(); 
Ss let future = async { 

34. printlin! ("howdy!") ; 

2a let. x = await! (almost ready (5) ); 

JD prantin! ("doner {07]"; 2); 

Siy F 

30 3 executor.run (future); 

ee ] 


ER 11-77 FE IRZ, LAH! 
[feature Carbitrary_self_types, futures_api) ]#/# ! 
[feature (async_await, await_macro, pin) ]。 这 些 都 是 异步 开发 需要 的 
未 稳定 特性 

代码 第 3 一 6 行 ， 引 入 了 futures-rs 奋 中 的 executor: : ThreadPool 和 和 
task: : SpawnExt。 回 想 一 下 Future 系 统 ， 这 里 需要 executor 和 task 模 块 
来 调度 和 执行 具体 的 异步 任务 。 


代码 第 7 一 9 行 ， 引 入 了 标准 库 中 的 Future、Pin 和 task 相 关 类 型 。 它 


们 是 为 async/await 寞 步 语 法 服务 的 。 

代码 第 10 一 13 行 ， 创 建 了 AlmostReady 结 构 体 ， 包 含 bool 类 型 的 
ready 和 i32 关 型 的 value 两 个 字段 。 

代码 第 14 一 16 行 ， 创 建 了 almost_ready 函 数 ， 它 接收 一 个 让 2 类 型 的 
值 ， 返 回 一 个 ready 默 认为 false 的 AlmostReady 结 构 体 实例 。 

代码 第 17 一 30 行 ， 为 AlmostReady 结构 体 实 现 Future。 其 中 poll 
方法 的 参数 需要 是 Pin<&mut Self> 类 型 ， 以 及 一 个 可 以 唤醒 任务 的 名 
W Jw， 它 是 一 个 引用 类 型 &LocalWaker， 如 果 任 务 已 经 准备 好 轮 询 ， 则 
由 它 来 通知 Executor 进 行 调 上 度 。 在 poll 方 法 的 实现 中 ， 会 判断 当前 任务 ， 
也 束 是 AlmostReady 实例 的 ready 字段 是 否 为 tue。 如 果 为 true， 则 返 
回 Poll: : Ready (self.valuet1) ， 表 示 寞 步 计 算 的 最 终结 果 ; 如 果 为 
false， 则 继续 进行 计算 ， 直 到 将 ready 字 段 设置 为 tue， 代 表 此 时 计算 已 
Wo TAIN, lw etl wake Ji, KEES URE, SR RK 
轮 询 。 所 谓 响 醒 ， 实 际 上 整 是 将 该 异步 任务 重 狐 加 入 任务 队列 中 。 可 以 
回顾 图 11-13 展 示 的 Executor 和 Task 工 作 机 制 。 最 后 返回 Poll: : 
Pending， 代 表 本 次 轮 询 的 结 末 。 

接 下 来 ， 在 main 函 数 中 定义 和 执行 异步 任务 。 

代码 第 32 行 ， 通 过 ThreadPool: : new 方 法 创建 一 个 调度 器 实例 
eXecutor。 

代码 第 33 一 37 行 ， 通 过 async 据 创建 Future 实 例 future。 在 async 抉 中 
+almost_ready KA ŽUR H HY J 44 AlmostReady3£ (Wl S Fawait! ZH, AF 
异步 任务 执行 的 结 

代码 第 38 行 ， 调 用 executor 的 run 方 法 将 future 传 入 ， 异 步 任 务 将 执 
行 。 继 续 回 顾 图 11-13 展 示 的 Executor 和 Task 工 作 机 制 。 在 run 方 法 中 ， 
会 将 传 入 的 future 打 所 成 一 个 FutureObj 对 象 ， 并 将 其 通过 内 置 的 
spawn_obj 方 法 发 送 到 Channel 队 列 中 ， 等 待 work 方 法 执行 该 任务 。 

对 于 该 示 例 人 代码， 可 以 到 随 书 源码 中 本 草 目 录 下 的 futures-demo 项 
目 中 进行 查看。 最 后 ， 编 诺 运行 该 示例 代码 ， 输 出 结果 如 代码 清单 11- 
78 所 示 。 

代码 清单 11-78: async/await 异 步 开 发 示例 的 输出 结果 


howdy! 
done: 6 

回顾 整个 异步 开发 机 制 ， 实 际 上 可 以 忌 结 为 两 点 : 

` 实现 Future， 构 造 寞 步 任 务 。 

` 生成 Task， 计 算 异 步 任 务 。 

其 中 Task 束 像 古 在 线程 基础 上 又 抽象 出 来 的 一 层 “ 轻 量 级 线程 "， 其 
使 用 语法 也 和 线程 短 不 多 ， 比 如 在 futures-rs 库 中 内 置 了 spawn_obj 和 
spawn 等 图 数 来 方便 开 及 者 将 Future 放 入 其 中 ， 生 成 异步 任务 。 正 因为 如 
此 ， 也 有 人 将 Future 弄 步 开 有 发 体系 称 为 用 户 级 线程 。 

在 futures-rs 库 中 还 提供 了 很 多 方便 组 合 或 散 僚 Future 寞 步 任 务 的 各 
种 组 合 函 数 ， 限 于 解 幅 ， 这 里 束 不 一 一 介绍 了 ， 读 者 可 以 目 行 但 看 其 文 
人 


11.4 数据 并 行 


在 过 去 的 几 十 年 里 ， 人 类 不 俘 地 提升 计算 机 的 算 力 。 计 算 机 在 许多 
领域 的 发 展 十 分 迅猛 ， 随 看 人 类 前 进 的 步伐 ， 越 来 越 多 的 领域 对 计算 的 
要 求 越 来 越 高 ， 竺 解雇 问题 的 规模 也 在 不 断 增加 。 因 此 ， 对 并 行 计 算 的 
要 求 束 越 来 越 强烈 。 

对 于 这 个 问题 大 致 有 两 种 解决 方案 : 任务 并 行 (Task 
Parallelism) 和 数据 并 行 (Data Parallelism)  。 任 务 并 行 是 指 将 所 需 
要 执行 的 任务 分 配 到 多 个 核 上 ;数据 并 行 是 指 将 需要 处 理 的 数据 分 配 到 
多 个 核 上 。 因 为 数据 并 行 处 理 起 来 比 任务 并 行 更 加 简单 和 实用 ， 上 所 以 得 
到 重点 关注 。 

按 Flynn 分 类 法 ， 将 计算 机 系统 结构 分 为 四 类 ， 如 图 11-16 所 示 。 


SISD SIMD 
single Instruction single Instruction 
Single Data Multiple Data 





MISD MIMD 
Multiple Instruction Multiple Instruction 
Single Data Multiple Data 





11-16: 计算 机 系统 结构 分 类 
SISD 是 指 单 指令 单数 据 的 单 CPU 机 器 ， 它 在 单一 的 数据 流 上 执行 
上 令 。 可 以 说 ， 任 何 单 CPU 的 计算 机 都 是 SISD 系 统 。 
MISD 则 是 指 有 N 个 CPU 的 机 器 。 在 这 种 架构 下 ， 底 层 的 并 行 实际 
上 是 指令 级 的 并 行 ， 也 就 是 说 ， 有 多 个 指令 来 操作 同一 组 数据 。 但 是 
MISD 在 实际 中 很 少 被 用 到 。 
SIMD 是 指 包含 了 多 个 独立 的 CPU， 每 一 个 CPU 都 有 自己 的 存储 


单元 ， 可 以 用 来 存储 数据 。 所 有 的 CPU 可 以 同时 在 不 同 的 数据 上 执行 同 
一 个 指令 ， 也 就 是 数据 并 行 ”。 这 种 架构 非常 实用 ， 便 于 算法 的 设计 和 
实现 。 

MIMD ”是 应 用 最 广泛 的 一 类 计算 机 体系 。 访 架构 比 SIMD 架 构 更 
强 ， 通 常用 来 解决 SIMD 无 法 解决 的 问题 。 


11.4.1 什么 是 SIMD 


SIMD 的 思想 其 实 很 容易 理解 。 以 加 法 指令 为 例 ， 如 果 采 用 SISD 染 
构 来 计算 ， 则 雷 要 先 访 问 内 存 ， 取 得 第 一 个 操作 数 ， 然 后 再 访问 内 存 ， 
取得 第 二 个 操作 数 ， 最 后 才能 进行 求 和 运算 。 但 是 如 果 采 用 SIMD 架 
构 ， 则 可 以 一 次 性 从 内 存 中 获得 两 个 操作 数 ， 然 后 执行 求 和 运算 。 

更 专业 的 描述 是 ，SIMD 是 一 种 采用 一 个 控制 吉 控 制 多 个 CPU， 同 
时 对 一 组 数据 《〈 同 量 数据 ) 中 的 每 一 个 数据 分 别 执行 相同 的 操作 而 实现 
空间 上 数据 并 行 的 技术 。 

起 源 和 历史 

SIMD 起 源 于 美国 首 批 超级 计算 机 之 一 的 IELIAC IV 大 型 机 中 ， 它 拥 
有 64 个 处 理 器 单元 ， 可 以 同时 进行 64 个 计算 。 随 着 现代 多 媒体 技术 的 发 
展 ， 各 大 CPU 生产 丙 陆 续 扩 展 了 多 媒体 指令 集 ， 人 允许 这 些 指令 一 次 处 理 
多 个 数据 。 最 早 是 Pntel 的 MMX (MultiMedia eXtensions) 指令 集 ， 包 
含 了 57 个 多 媒体 指令 、8 个 64 位 窜 存 右 。 然 后 是 SSE (Streaming SIMD 
Extensions) ”指令 集 ， 它 弥补 了 MMX 浮 点 数 文 持 不 足 的 问题 ， 并 将 寄 
存 器 的 宽度 扩展 到 128 位 ， 引 入 了 70 个 新 指令 。 接 下 来 陆续 出 现 了 
SSE2、SSE3、SSE4 和 SSE5 指 令 集 。 指 令 集 的 不 断 扩 展 ， 其 实 背 后 暗含 
了 了 CPU 巨头 之 间 的 市 场 战争 。 但 是 对 于 开发 者 来 说 ， 束 比较 厅 烦 了 。 

2011 年 Intel 发 布 了 全 新 的 处 理 器 微 架 构 ， 其 中 增加 了 新 的 指令 集 
AVX (Advanced Vector Extensions) ， 进 一 步 把 寄存 器 的 宽带 扩展 到 
256 位 ， 并 且 革 新 了 指令 格式 ， 文 持 三 目 运算 。 我 国 *“ 天 河 二 号 ?超级 计 
算 机 的 核心 技术 便 是 AVX-512 的 SIMD， 该 技术 将 寄存 器 的 宽度 扩展 到 
512 位 。AVX 具 有 256 位 寄存 右 ， 可 同时 进行 4 个 64 位 计算 ， 或 8 个 32 位 计 
算 ， 或 16 个 16 位 计算 ， 甚 至 32 个 8 位 计算 。 

术语 介绍 


F Ay TF aa HY he RE AT LOR SIMD EAE FEAT 2 SEAVX-2565K 
说 ， 如 果 按 4 个 64 位 进行 计算 ， 束 可 以 看 成 是 4 个 并 行 计算 通道 。 而 在 
SIMD 中 并 行 计 算 可 以 分 为 多 种 计算 模式 ， 其 中 有 竺 直 计算 和 水 平 计 
算 ， 如 图 11-17 所 示 。 

在 垂直 计算 中 ， 每 个 并 行 通道 都 包含 的 符 计 算 值 称 为 标量 值 ， 通 道 
按 水 平方 回 进 行 组 织 。 将 加 法 运算 中 X 和 Y 的 数据 在 对 直方 同上 进行 求 
和 。 在 垂直 计算 中 ， 每 组 计算 的 标量 值 都 来 自 不 同 的 源 。 水 平 计算 则 是 
将 并 行 通道 垂直 组 织 ， 依 次 对 两 个 相 邻 通道 的 标量 值 进 行 求 和 。 在 水 平 
计算 中 ， 每 组 计算 的 标量 值 都 来 自 同一 个 源 。 


+ + + + + —— _ —— — ———— 
Y \ \ J / 


X+Y X1+Y1 X2+Y2 X3+Y3 X4+Y4 XI+X2 X3+X4 Yl+Y2 Y3+Y4 
普通 指令 垂直 计算 的 SIMD 指 令 水 平 计算 的 SIMD 指 令 





图 11-17: SIMD 指 令 的 垂直 计算 和 水 平 计算 示意 图 

这 种 并 行 计 算 也 是 有 限制 的 。 对 于 不 同 的 指令 集 ， 一 次 数据 并 行 能 
接受 的 长 度 是 固定 的 ， 比 如 AVX-256， 能 接受 的 长 度 为 256 字 节 。 

编写 SIMD 数 据 并 行 的 代码 称 为 回 量 化 (Vectorization) . eK 
为 同 量 (Vector) 是 一 个 指令 操作 数 ， 包 含 一 组 打包 到 一 维 数组 的 数 
据 元 际 。 大 多 数 SIMD 指 令 都 是 对 癌 量 操作 数 进 行 操 作 的 ， 所 以 同 量 也 
被 称 为 SIMD 操 作 数 或 打包 操作 数 。 数 据 并 行 意 味 看 可 以 同时 对 同 量 
的 所 有 数据 元 又 执行 变换 操作 。 所 以 ， 将 编写 程序 使 用 回 量 处 理 上 右 的 过 
程 ， 称 为 同 量 化 、 矢 量化 或 SIMD 化 。 同 量化 可 以 由 编译 鼎 目 动 优 化 ， 
也 可 以 由 程序 员 手 动 指 定 。 


11.4.2 在 Rust 中 使 用 SIMD 


Rust 从 1.27 版 本 开始 支持 SIMD， 并 且 上 默认 为 x86 和 x86_64 日 标 启用 


SSE 和 SSE2 优 化 。Rust 基 本 文 持 市 面 上 90% 的 SIMD 指 令 集 ， 从 SSE 到 
AVX-256。 不 过 ， 目 前 还 不 支持 AVX-512， 在 不 久 的 将 来 会 支持 。 

Rust 通过 标准 库 std: : arch 和 第 三 方 库 stdsimd 结合 的 方式 来 文 持 
SIMD. Rust ”对 SIMD 的 支持 是 属于 比较 底层 的 ， 在 标准 库 中 支持 多 种 
CPU 平台 架构 ， 比 如 x86、x86 64、ARM、AArch64 等 。 每 种 架构 都 有 
相应 的 模块 ， 比 如 std: : arch: : x86 模 块 定 义 的 就 是 与 x86 平 台 相 关 的 
SIMD 指 令 。 并 有 旦 在 平台 模块 中 所 有 的 函数 都 是 unsafe 的 ， 因 为 调用 不 文 
持 的 平台 指令 可 能 会 导致 未 定义 行为 。 

SIMD 使 用 示例 

现在 我 们 来 看 一 个 人 简单 的 示例 。 使 用 cargo new 命令 创建 一 个 新 的 
crate， 命 名 为 “simd-demo”。 在 Cargo.toml 文 件 中 加 入 依赖 的 第 三 方 库 
stdsimd， 本 书 示 例 使 用 0.1.0 版 本 ， 然 后 编写 src/main.rs 文 件 ， 如 代码 清 
单 11-79 所 示 。 

代码 清单 11-79: SIMD 使 用 示例 
#! [feature (stdsimd) ] 


use vista as real std; 


4 


use stdsimd as std; 
#[cfig(target arch = "x86") ] 
se fi stat starch: teo5is*; 
#[cfg(target arch = "x86 64") ] 
use 8iShCs arenes R50 Sti st; 
fn main() { 
lf 18 x86 feature detected! ("see4.2") d 


#[target feature (enable = "sse4.2") ] 


O @ aI Cf CFF eh GH BO 


H 
G3 a 


i DP unsafe fn worker() { 


Le let needle = b"\r\n\t ignore this "; 

13; let haystack = b"Split a \r\n\t line "; 

14. lert a = mm ladu 51175 Mesdle.as PECE) 26 WOE 17 
Las let b = Wi load S1125 (haystack. prr() as *canst Ji 
16. let idx = mm empestri| 

Tis a, 3, b, 20, SIDD CMP EQUAL ORDERED 

18. ) ; 

La, aSSert eg! (ids, 0) / 

£0. } 

Als unsafe { Wworker()}; J 

Zs } 

Sa | 


在 代码 清单 11-79 F, HEH y H! [feature (stdsimd) ] 特性 ， 
这 意味 着 日 前 使 用 stdsimd 库 需要 Nightly 环 境 。 

代码 第 2 行 ， 使 用 了 use 的 别名 功能 ， 将 标准 库 std 的 库 名 换 成 了 男 外 
一 个 名 字 “real_std”。 因 为 这 里 想 把 std 这 个 名 称 指 代 为 stdsimd 库 ， 如 代 
但 第 3 行 所 示 。 

WGA, (HAS # [cfg (target_arch= " x86") ] 条 件 编译 属 
性 ， 相 当 于 静态 检测 CPU 平台 巢 构 ， 如 条 十 x86 和 平台， 则 编译 该 属性 下 
方 的 代码 ， 也 就 是 引入 在 std: : arch: : x86 模 块 中 定义 的 函数 。 

代码 第 6 行 ， 同 理 ， 静 态 检测 CPU 平台 为 x86_64， 然 后 进行 条 件 编 
译 。 

在 main 了 水 数 中 ， 代 人 码 第 9 行 的 让 条 件 使 用 Sis x86 feature detected! 
C"sse4.2") 安 ， 它 是 一 种 动态 检测 CPU 平台 的 扩 术 ， 因 为 有 时 需要 
在 运行 时 来 检测 CPU 平台 。 这 里 是 判断 当前 代 但 执行 的 CPU 平台 是 否 文 

持 SSE4.2 指 令 集 。 

代 但 第 11 一 20 行 ， 定 义 了 一 个 unsafe 函 数 worker， 充 函数 将 使 用 
SIMD 指 令 来 执行 字符 串 搜 索 任 务 。 因 为 要 用 到 SIMD 指 令 ， 所 以 该 函数 
被 标记 为 unsafe 的 。 

代码 第 12 行 和 第 13 行 ， 分 别 定义 了 搜索 用 到 的 两 个 字符 串 ， 即 
needle 和 havystack。 这 里 是 想 要 在 haystack 中 查找 匹配 needle 的 子 串 位 


置 。 
代码 第 14 行 ， 调 用 了 _mm_loadu_si128 函 数 ， 该 函数 接收 一 个 

ml28i 关 型 的 原生 指针 ， 它 会 从 内 存 中 将 长 度 为 128 位 的 整数 数据 加 
载 到 回 量 寄存 器 中 。 它 实际 调用 的 是 Intel 的 mm_loadu_si128 指 令 。 这 
里 是 将 needle 字 符 串 加 载 到 同 量 寄存 硕 中 。 

代码 第 15 行 ， 同 理 ， 将 haystack 字符 串 加 载 到 回 量 寄存 需 中 ， 这 
个 过 程 也 称 为 打包 字符 串 。 

代码 第 16 行 ， 调 用 了 _mm_cmpestri 函 数 。 该 函数 的 第 一 个 参数 a 是 
指 打 包 好 的 needle 字 人 符 串 ;第 二 个 参数 是 想 要 检索 的 长 度 ， 这 里 指定 为 
3; 第 三 个 参数 是 打包 好 的 haystack 字 符 串 b; 第 四 个 参数 是 其 长 度 ， 这 
里 指定 为 20; 第 五 个 参数 SIDD_CMP_EQUAL_ORDERED 是 指定 比较 
模式 说 明 符 ， 它 代表 字符 串 相 等 检测 模式 。 所 以 ， 整 个 mm_cmpestri 范 
数 要 做 的 束 是 在 haystack 和 字符 串 中 人 查找 罗 配 needle 前 三 位 的 索引 位 置 。 

代码 第 19 行 ， 通 过 断言 说 明 ， 满 足 匹 配 条 件 的 字符 串 索 引 位 置 是 


最 后 执行 cargo run 命令 ， 访 段 代 但 可 以 正音 编译 运行 。 请 注意 运行 
该 段 代码 的 其 体 CPU 染 构 ， 如 果 其 不 支持 SSE4.2， 则 无 法 运行 。 

以 上 是 手动 使 用 内 置 的 平台 函数 同 量化 代码 ， 其 实 Rust 还 可 以 利用 
LLVM 目 动 问 量化 。 在 Src 目 孙 下 新 增 auto_vector.rs 文 件 ， 并 编写 新 代 
码 ， 如 代 人 码 消 日 11-80 所 示 。 

代码 清单 11-80: 利用 LLVM 自 动向 量化 为 AVX2 指 令 集 


lL. fh add quickly fallback(a: @[U8], Bi &(UB], C smut [us]) 4 
a fer ({(a, Bb), ©) in a. iter().2ip (>) .zipte) 1 

3a to = *0 + +p} 

4. } 

a 3 

6. #lefg(any (target. arch = "x86", target arch = "x86 64”))] 

Te #[target feature(enable = "ayxgz") ] 

8. unsafe fn add quickly avxZ2(a: &[u8], b: &[u8], c: &mut [us]) { 
3 add quickly fallback(a, b, c) 

lOe 3 

lls fn add quickly(as guo) Bb: &lusl; ce emut [ugly i 

Les t [cfg (any (target arch = "x86", target arch = "x86 64"))] 
La. { 

14. LË is x66 feature detected! ("avez") 1 

13s printin! ("suppert avxz") ; 

16. return unsafe { add quickly ayxi (á; By 0) J 

i } 

Le } 

1) add quickly fallback(a, b, c) 

20a 3 

Ji» Le. Malin) 4 

Oe a let mut dst = [U, 2]; 

Lo add quickly(&[ly 2], &[2; 3], &mut dst); 

24. assert eq! (UBL: [37 3l)? 

Zis | 


在 代码 清单 11-80 中 ， 代 码 第 1 一 5 行 ， 首 先 定 义 了 
add_quickly_fallback 函 数 ， 可 以 将 传 入 的 第 三 位 参数 切 户 中 的 元 素 蔡 换 
为 前 两 位 参数 切 厂 的 元 系 之 和 和 。 

代码 第 ”6~10 47, X} add_quickly_avx2 函数 使 用 了 # 
[cfg (Cany (target arch=" x86" , target_arch= " x86_64" ) ) ] ## 
[target_feature (enable= " avx2 " ) | 属性 修饰 ， 目 的 就 是 为 了 让 
LLVM 目 动 问 量化 该 函数 ， 限 定 平 台 范 围 为 x86 和 x86_64， 并 且 问 量化 
为 AVX2 指 令 集 。 在 该 函数 内 部 调用 了 add_quickly_fallback 函 数 。 


AGA IIL~ 2077, FE Y add_quickly K% E1% PRA A FH Ta) PE H 
J #[cfg (any (target_arch= " x86" , target_arch="x86_64") ) ] 属 性 
限定 平台 范围 为 x86 和 x86_64。 在 此 限定 下 ， 又 使 用 动态 检测 安 
is x86 feature detected! ( "avx2" ) 判断 当前 执行 平台 是 人 否 文 持 
AVX2 指 令 集 ， 只 有 在 文 持 的 情况 下 ， 才 可 以 使 用 add_quickly_avx2 函 
数 。 如 果 当 前 执行 平台 支持 AVX2， 则 代码 第 15 行 的 打印 语句 会 有 相应 
的 输出 。 

如 果 不 是 x86 或 x86_64 平 台 ， 则 继续 使 用 add_quickly_fallback 函 数 进 
ITR. REP FRR TER. wa Emaint žr y H 
add_quickly A žit. 

接 下 来 ， 还 需要 修改 Cargo.toml 文件 ， 才 能 执行 该 段 代 码 。 因 为 在 
当前 src 目录 下 出 现 了 main.rs 和 auto_vector.rs 两 个 市 有 main 范 数 的 文件 。 
打开 Cargo.toml 文 件 ， 进 行 bn 相关 配置 ， 如 代码 清单 11-81 所 示 。 

代码 清单 11-81: 在 Cargo.toml 文 件 中 进行 bin 相 关 配 置 


[ [bin] ] 

path = "srce/auto vector.rs" 
nae = “Suro verror” 

Loam] ] 

path = "src/main.rs" 

name = "main" 


EE AY Bc St BY M ik crate xtg “main ee ža. 
最 后 ， 只 要 执行 cargo run--bin auto_vector im, LAT LAAT 


auto_vector.rs 中 有 的 代码 。 同 理 ， 如 果 想 执行 main.rs 中 的 代码 ， 则 需要 使 


用 cargo run--bin main 命令 。 
SIMD 命 名 说 明 


在 代码 清单 11-79 中 ， 调 用 SIMD 函 数 的 命名 乍 一 看 会 感觉 非常 奇 
怪 ， 但 实际 上 它们 的 命名 遭 循 一 定 的 规则 。 吏 拿 x86 平 台 来 说 ， 其 主要 
文 持 以 下 几 种 类 型 . 

._ m128i ， 代 表 128 位 宽度 的 整数 癌 量 类 型 。 
ml128 ， 代 表 128 位 宽度 的 4 组 人 2 类 型 。 

_m128d ， 代 表 128 位 宽度 的 2 组 f64 类 型 。 


Im256i ， 代 表 256 位 宽度 的 整数 癌 量 类 型 。 

im256 ， 人 代表 256 位 宽度 的 8 组 f32 类 型 。 

Im256d ， 代 表 256 位 宽度 的 4 组 f64 类 型 。 

也 有 其 他 类 型 ， 这 里 不 再 歼 述 。 像 ARM 平 台 文 持 的 类 型 命名 惑 比 
较 直 观 ， 比 如 : 

` float32x2_t ， 代 表 64 位 冤 度 的 2 组 打包 {32 同 量 类 型 。 

.float32x4 t ， 代 表 128 位 宽度 的 2 组 打包 f32 癌 量 类 型 。 

` int32x2_t ， 代 表 64 位 宽度 的 2 组 打包 i32 同 量 类 型 。 

` int32x4_t ， 代 表 128 位 客 上 度 的 2 组 打包 i32 同 量 类 型 。 

虽然 各 个 平台 的 命名 格式 不 同 ， 但 是 其 内 部 还 是 有 规则 可 循 的 。 

cH, eA 4th AA. WME K žtstd: : arch: : x86: : 
_mm256_add_epi64 来 说 ， 以 mm256 开头 的 代表 AVX 指 令 ， 然 后 跟随 
的 是 对 应 的 指令 操作 ， 比 如 add、mul 或 abs 之 类 的 ， 最 后 是 使 用 的 类 
型 ， 如 _pd 用 于 双 精 度 或 64 位 浮 点 数 ，_ps 用 于 32 位 浮 点 数 ，_epi32 用 于 
32 位 整数 。 在 不 同 的 平台 架构 下 ， 基 本 的 函数 命名 也 遵循 类 似 的 组 合 规 
则 。 

第 二 方 库 介绍 

除了 官方 提供 的 第 三 方 库 stdsimd，Rust 社 区 中 还 有 很 多 simd 库 ， 其 
中 比较 突出 的 是 faster 和 simdeez。 这 两 个 库 的 特色 是 ， 相 比 于 stdsimd 做 
了 更 进一步 的 抽象 ， 对 开发 者 友好 。 

WLS faster Kit, CHAS SIRS BL, MRENA m Ww ee E 
HANES FRAMARA, WTS 11-808 - 

代码 清单 11-82: 第 三 方 库 faster 捉 供 的 函数 示例 


1 use faster::*; 

2 fn main() { 

cP let two hundred = (&[2.0f32; 100][..]).simd iter() 

4 Sind reduce(i32s6(0.0), f328(0.0); lace; v| ace + y) 
5 “i 


assert eq! (two hundred, 200.0f32); 


从 代码 清单 11-82 中 可 以 看 出 ，faster 库 提供 了 很 多 可 读 性 很 高 的 函 
数 来 方便 开 及 者 开 及 SIMD 代 但 。 


11.5 小 结 


随 看 多 核 CPU 的 普及 ， 多 线程 并 发 编程 正 逐 渐 成 为 主流 的 编程 范 
式 。 但 是 多 线程 并 发 编程 与 生 俱 来 的 问题 十 分 严重 ， 使 得 开发 者 极 难 编 
写 出 正确 的 多 线程 并 发 程序 。Rust 语 言 为 安全 而 生 ， 它 不 仅 能 保证 内 存 
安全 ， 还 能 保证 并 发 安全 。Rust 依 靠 严 谨 的 类 型 系统 和 所 有 权 系 统 ， 玫 
助 开发 者 在 编译 时 天 能 发 现 多 线程 并 发 程序 中 出 现 的 数据 竞争 问题 ， 从 
而 保证 线程 安全 。 

在 Rust 标准 库 中 提供 了 保证 线程 同步 的 互 斥 锁 和 读 写 锁 ， 以 及 屏 
障 和 条 件 变量 。Rust 也 从 C++11 那里 继承 了 多 线程 内 存 模 型 ， 实 现 了 原 
子 类 型 。 基 于 “使 用 通信 来 共享 内 存 ” 的 理念 ， 提 供 了 多 生产 者 单 消费 者 
通信 队列 ， 可 以 实现 跨 线 程 通信 ， 从 而 实现 无 锁 编 程 。 

通过 本 章 中 提供 的 大 量 多 线程 编程 示例 ， 可 以 使 读者 对 使 用 Rust 编 
写 正 确 的 多 线程 并 发 程序 有 更 深入 的 了 解 。 

除了 多 线程 安全 并 及 ，Rust 的 玖 一 个 目标 是 成 为 高 性 能 网 络 服务 开 
及 的 首选 语言 。 所 以 ，Rust 语言 开始 逐步 文 持 async/await FYFE o 
通过 本 章 的 和 学习， 我 们 了 解 到 Rust 文 持 asyncawait 的 曲 打 过 程 ， 同 时 也 
感受 到 了 Rust 有 异步 开发 的 方便 和 强大 之 处 。 虽 然 目前 异步 开发 还 未 稳 
定 ， 但 也 用 不 了 多 久 就 会 稳定 的 。 

作为 现代 化 系统 编程 语言 ，Rust 还 支持 SIMD 数 据 并 行 。 数 据 并 行 
和 异步 开发 类 似 ， 还 未 完全 稳定 ， 如 果 想 使 用 它 ， 则 需要 准备 Nightly 环 
境 。 


相信 在 不 还 的 将 来 ，Rust 在 并 及 编程 和 数据 并 行 领域 将 大 放 开 彩 。 





[1 此 处 并 非特 指 某 一 个 操作 系统 。 在 Linux 内 核 中 调度 单位 是 task， 但 也 可 以 看 作 是 线程 。 

[2] 请 参见 play.rust-lang.org。 

[3] 缩写 Kx 和 rx 为 通信 专业 术语 ，tx 中 的 t 代 表 Transimt，Frx 中 的 r 代 表 Receive， 都 加 上 x 是 为 了 避免 缩写 混 消 。 

[4] threadpool 包 的 源码 地 址 : https: //crates.io/crates/threadpool， 本 章 中 与 线程 池 相关 的 演示 代码 对 其 做 了 部 分 精 
fj o 

[5] 源码 地 址 : https: //github.com/rayon-rs/rayon. 

[6] 此 处 基于 Rust Nightly 1.30 版 本 。 

[7] 此 处 基于 futures-rs 0.3 版 本 。 


第 12 章 元 编程 


WA, -AD, CH=, =H. 

元 编程 来 源 于 Meta-Programming 一 词 。Meta #™ma“KRP REAL 
的 某 事 ”。 比 如 Meta-Knowledge， 代 表 “ 关 于 知识 本 里 的 知识 ”， 称 为 元 
知识 。 有 再 如 Meta-Cognition， 代 表 “ 关 于 认 知 本 里 的 认 知 ”， 称 为 元 认 
知 。 所 以 ，Meta-Programming 驳 代表 了 元 编程 。 人 类 通过 培 拳 和 扩展 目 
己 的 元 知识 或 元 认 知 ， 束 可 以 拥有 独立 思考 进一步 产生 新 知识 或 新 认 知 
的 能 力 。 同 样 ， 通 过 元 编程 的 手段 可 以 让 程序 生成 新 的 程序 。Meta 被 详 
为 “元 ”， 在 语义 上 比较 合理 , “元 ”有 本 涯 和 开端 之 意 ， 和 中 国 的 道家 思 
AETHER o 

元 编程 在 计算 机 领域 是 一 个 非常 午 要 的 概念 ， 它 允许 程序 将 代码 作 
为 数据 ， 在 运行 (或 编译 ) 时 对 代码 进行 修改 或 蔡 换 ， 从 而 让 编程 语言 
产生 更 加 强大 的 表达 能 力 。 总 之 ， 元 编程 束 是 文 持 用 代码 生成 代码 的 一 
种 方式 。 各 种 编程 语言 中 或 多 或 少 部 提供 了 基本 的 元 编程 能 力 。 保 C 或 
C++ 中 ， 可 以 使 用 预 编 详 项 对 宏 定义 进行 文本 答 换 。 像 Rust、Ruby 或 
Elixir 等 语言 ， 则 是 通过 操作 抽象 语法 树 CAST) 来 提供 更 强大 的 元 编程 
能 力 。 另 外 ，Rust 中 利用 泛 型 进行 静态 分 及 ， 所 以 泛 型 也 是 元 编程 的 一 
种 能 力 ， 同 样 ，C++ 中 的 模板 也 可 以 做 到 和 谤 型 编程 类 似 的 事情 。 

元 编程 技术 大 概 可 以 分 为 以 下 几 次 。 

. fay FIC ANS He ， 比 如 ，C/C++ 中 的 宏 定 义 ， 在 编译 期 直接 进 行文 
KER. 

. 类 型 模板 , ， 比 如 C++ 语言 文 持 模板 元 编程 。 

- Sey ， 比 如 ，Ruby、Java、Go 和 Rust 等 或 多 或 少 都 文 持 反 射 ， 在 
运行 时 或 编译 时 获取 程序 的 内 部 信息 。 

语法 扩展 ， 比 如 ，Ruby、Elixir、Rust 等 语言 可 以 对 抽象 语法 树 
进行 操作 而 扩展 语言 的 语法 。 

. 代码 目 动 生成 ， 比如 ，Go 语 言 提 供 go generate 命 令 来 根据 指定 的 
注释 目 动 生成 代码 。 


其 实 语 法 扩展 和 代码 目 动 生成 的 关系 比较 微妙 ， 语 法 扩展 是 对 AST 
进行 扩展 ， 实 际 上 也 相当 于 生成 了 代码 。 但 是 语法 扩展 是 为 了 扩展 语法 
而 生成 代码 ， 比 如 Rust 的 derive 属 性 ， 可 以 为 结构 体 目 动 实现 一 些 trait。 
而 代码 目 动 生成 是 指 在 开发 中 为 了 减少 代码 重复 或 其 他 原因 而 目 动 生成 
= 

使 用 元 编程 可 以 做 到 很 多 普通 函数 做 不 到 的 事情 ， 比 如 复 用 代码 、 
编写 领域 专用 语言 (DSL) 等 。Rust 语 言 通过 反射 和 AST 语 法 扩展 两 种 
手段 来 文 持 元 编程 。 


12.1 反射 


BON (Reflect) 机制 一 般 是 指 程序 日 我 访问 、 检 测 和 修改 其 日 号 状 
态 或 行为 的 能 力 。Rust 标 准 库 提供 了 std: : any: : Any 来 文 持 运行 时 反 
OPT 
代码 清单 12-1 展 示 了 Any 的 定义 。 
代码 清单 12-1: Any 定义 
DUD Esl Any: REAELE 4 
fn get type id(&self) -> Typeld; 
} 
impl<T: ‘static + ?Sized > Any for I 1 
fn get type id(&self) => Typéeld. { Typéelid::oft:<T>() 1 
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} 
代码 清单 12-1 中 第 1 一 3 行 展 示 了 Any 的 定义 ， 注 意 到 该 trait 加 上 了 
' static ”生命 周期 限定 ， 意 味 着 该 trait 不 能 被 非 静 态 生命 周期 的 类 型 实 
现 。 代 三 第 4 一 6 行 显示 ，Rust 中 满足 ”static ”生命 周期 的 类 型 均 实现 了 
ee 

其 中 ，get_type_id 方 法 返回 TypeId 类 型 ， 代 表 Rust 中 某 个 类 型 的 全 
局 唯一 标识 ， 它 是 在 编译 时 生成 的 。 每 个 TypeId 都 是 一 个 “ 黑 盒 ”， 不 能 
检查 其 内 部 内 容 ， 但 是 允许 复制 、 比 较 、 打 印 等 其 他 操作 。Typeld 同 样 
仅 限 于 静态 生命 周期 的 类 型 ， 但 在 未 来 可 能 会 取消 该 限制 。 

Any 还 实现 了 一 些 方法 用 于 运行 时 检测 类 型 ， 比 如 is 方法 ， 如 代码 
清单 12-2 所 示 。 
代码 清单 12-2: Any 中 实现 的 让 方法 源码 示意 


il impl Any{ 

2 pub fn is<T: Any>(&self) -> bool { 
E let t = Typeld::of::<T>(); 

4. let boxed = seli.get type 1d()? 
5 t == boxed 

6 } 

} 


代码 清单 12-2 中 ， 为 Any 实 现 了 is 方法 ， 因 为 Any 是 trait， 所 以 这 里 
的 is 方法 的 &self 必 然 是 一 个 trait 对 象 。 

代码 第 3 行 通 过 TypeId: : of 函数 来 获取 类 型 TT 的 全 局 唯一 标识 从 t。 

代码 第 4 行 通过 调用 self 的 get_type_id 方 法 ， 同 样 得 到 一 个 全 局 唯一 
标识 符 boxed。 通 过 代码 清单 12-1 也 得 知 ，get_type_id 方 法 内 部 实际 上 也 
是 调用 了 Typeld: : of 函数 。 

代码 第 5 行 通过 比较 t 和 boxed 是 否 相等 ， 最 终 返 回 bool 类 型 的 值 。 


12.1.1 WH Wis Ph BFR 


代码 清单 12-3 展 示 了 is 函数 的 一 些 用 法 。 
代码 清单 12-3: oo cig tsi al 


use std: : {Any, Typeld}; 
enum E { H, ies lig 
Struct S f BE US, YE te, 2: MLO j 


a o e 


fn main() { 


5 Let, VL = USOUTTee WI 

6, let v2 = E::He; 

Ty let ws = 5 { xX: 0xde; vi: Uxad, z: Uxbeet }; 
8 let v4 = "rust"; 

9 let mut a: &Any; 

LG a a= &vl; 

i assert (a41585 *<us2>) ); 

LAs BE Lm 
LS» a= &v2; 

14. assert. (andast SEY ()) 3 

LS. pranelnt (* Li? y Typeld: not ys em 

| oe a= &v3; 

¢ ee assert! (a..318%%#<S>{)); 

LB x printing Woe Ly sofr: SSA]? 
Les a= &v4; 

es assert! (Asise ESTES ()) 2 

Aa A E Br LALLA tt TII Mroeiat tats: SNEER () i 
Bee | 


代码 清单 12-3 中 ， 第 2 行 和 第 3 行 是 两 个 日 定义 类 型 ， 枚 举 体 E 和 结 
构 体 S。 在 main 函 数 中 ， 通 过 调用 is 函数 来 判断 类 型 。 
代码 第 5 一 8 行 分 别 声 明了 绑 定 v1 为 u32 类 型 、v2 为 枚 举 体 实 例 、v3 
为 结构 体 实 例 、v4 为 字符 串 字 面 量 。 
代码 第 9 行 声 明了 可 变 绑 定 a 为 &Any 类 型 ，&Any 在 此 处 用 作 trait 对 
象 。 从 第 11 行 开始 ， 直 到 第 21 行 ， 是 分 别 把 a 的 值 指定 为 v1 到 v4， 然 后 
通过 is 函 数 判 断 它们 的 类 型 。 与 此 同时 ， 使 用 了 Typeld: : of 方法 分 别 
打印 这 些 类 型 的 全 局 唯一 标识 符 。 
代码 可 以 正 第 编译 运行 ， 输 出 结束 如 代码 清单 12-4 所 示 。 
代码 清单 12-4: 输出 结果 
TypeId { t: 12849923012446332737 } 
TypeId { t: 5631867483134288688 } 


t 
TypeId { t: 12999454250885020441 } 
TypeId { t: 1229646359891580772 } 


从 代码 清单 12-4 中 看 得 出 来 ，TypeId 是 一 个 结构 体 ， 其 字段 t 存 储 了 
一 串 数 字 ， 这 就 是 全 局 唯一 类 型 标识 符 ， 实 际 上 是 u64 类 型 。 代 表 唯 一 
标识 从 的 这 串 数 字 ， 在 不 同 的 编译 环境 中 ， 产 生 的 结果 是 不 同 的 。 所 以 
在 实际 开发 中 ， 最 好 不 要 将 TypeId 暴 露 到 外 部 接口 中 被 当 作 依赖 。 


12.1.2 转换 到 具体 类 型 


Any 也 提供 了 downcast_ref 和 downcast_mnut 两 个 成 对 的 泛 型 方法 ， 
用 于 将 汉 型 工 回 下 转换 为 具体 的 类 型 ， 返 回 值 分 别 为 Option<&T> 之 和 
Option<&mut TT 类型。 其 中 downcast_ref 将 类 型 TT 转换 为 不 可 变 引 用 ， 
而 downcast_mut 将 类 型 T 转 换 为 可 变 引 用 。 代 码 清 单 12-5 展 示 了 了 
downcast_ref 的 用 法 。 
代码 消音 12-5: 使 用 downcast_ref| 由 下 转换 类 型 
ls use std::any::Any; 
2. #[derive (Debug) ] 
EA enum E { H, He, Li} 


4 Stee & T HS US, Yr DS, 2: Ule 1 

5 fn print any(a: sAny) { 

oe if let Some (y) = axdowncast refi s<usz() 4 

7 prints (USA 1i)"; We 

8 | else af Jet Sone(v) = a.dewheastl TOLES 1 
z printin! ("enum E {e7}", wie 

Les } Slee af let some(v) = a.downeast rere:<o>{) 4 
da PEINCIA! ("SCTE BB ey LE LIS y Maks Vite Wael? 
L2. } else { 

U: i prantin! ("elsel™jy 

14. } 

Le, d 

L6. fn Wale) į 

i y ge print any (& UxeOfifece u32); 

18. prine any(é E: He? 

A print any(& Si %: Oxde, y: Uxad,; z: Oxbeef |); 
20. DEINE Any(e "Rust" 3 

Al, print any (8 "hoge"j3 

22: f 


代码 清单 12-5 中 ， 从 第 5 一 15 行 定义 了 print_any 方 法 ， 以 &Any 作 为 
参数 类 型 。 在 print_any 方 法 中 ， 使 用 if let 语 句 对 downcast_ref 的 转换 结果 
进行 四 配 ， 如 有 果 转 换 成 功 ， 则 打印 相应 的 结 

在 main 函 数 中 ， 分 别 将 不 同 医 型 的 值 传 入 print_any 函 数 中 。 这 里 需 
要 注音 的 是 ， 参 数 必须 是 引用 ， 因 为 参数 类 型 为 trait 对 象 ， 而 大 部 分 类 
型 都 实现 了 Any。 最 终 的 输出 结果 如 代码 清单 12-6 所 示 。 

代码 清单 12-6: 打印 结 

u32 cOffee 
enum E He 
struct S de ad beef 


else! 
除 使 用 &Any 外 ， 也 可 以 使 用 Box<Any>， 如 代码 清单 12-7 所 示 。 
代码 清单 12-7: (EH Box<Any> 


1. use std::any::Any; 

Ze Ln print if strang(value: Box<Any>) { 

oe if let Ok(string) = value.downcast::<String>() { 
A. DEINCIN: ("Steno (LEDSCA t7): ti’; Stritc.lent), String); 
5. jelse{ 

Gs printini ("Nog Stering") 

Ty } 

Se d 

9. fn main() { 

LO s let my string = “Hello World”.to string () j 

Lis print if String (Box: imen my string) yi 

LZ a print 1f string (Box: :new(018) ); 

it: 1 


代码 清单 12-7 中 定义 了 print_if_string 函 数 ， 该 参数 使 用 了 了 Box 二 Any 
> 类型。 这 里 需要 注意 ， 因 为 Box 二 Any 二 类 型 是 独占 所 有 权 的 类 型 ， 
所 以 无 法 像 代 码 清 单 12-5 中 的 print_any 方 法 那样 匹配 多 种 类 型 。 
代码 第 3 行 的 计 _ let 匹配 中 ， 使 用 了 Box<Any> 实 现 的 downcast 方 法 
将 类 型 转换 为 String。 注 意 ，downcast 方 法 最 终 返 回 的 是 Result 类 型 。 
代码 执行 的 结束 如 代码 清单 12-8 所 示 。 
代码 清单 12-8: 打印 结果 
String (length 11): Hello World 
Not String 


12.1.3 JERA E a JA HAR 


非 静 态 生 命 周 期 类 型 没有 实现 Any， 如 代码 清单 12-9 所 示 。 
代码 清单 12-9: 非 静 态 生命 周期 类 型 没有 实现 Any 


use Sta? i any: Any; 
struct UnStatic<."a> 4 =: £*a 282 } 
fn main() { 

let a = 42; 

let v = UnStatic { x: &a }; 

let mut any: é&Any; 

//any = &v; // 编译 错误 
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- 2 

代码 清单 12-9 中 定义 了 一 个 市 引用 字段 的 结构 体 UnStatic<”′ a>, 
注意 其 生命 周期 不 是 静态 C static) 生命 周期 。 

在 main 函 数 中 ， 第 6 行 声 明了 类 型 为 &Any 的 绑 定 any， 但 是 在 第 7 行 
将 UnStatic 和 的 引用 实例 &v 绑 定 给 any 的 时 候 ， 编 译 会 出 错 。 

如 果 使 用 一 个 静态 生命 周期 的 值 生成 UnStatic 实 例 ， 则 不 会 出 现 编 
详 错误 ， 如 代码 清单 12-10 所 示 。 

代码 消音 12-10: 使 用 静态 生命 周期 其 型 的 全 创建 UnStatic 实 例 


Le use Stat any? pany; 

Lis struct UnStatic<"a> i x: k'a i32 | 
3. static ANSWER: 132 = 42; 

4. fn main() { 

a let v = UnStatic { x: &ANSWER }; 
6. let mut a: &Any; 

ie a= &Vv; 

3. aSserc! (4.18% <UNnStacic> () } ¥ 

2a f 


Mis 12-10 中 ， 第 3 1TA% T PSAE ANSWER， 其 生命 周 
期 是 静态 的 ， 其 引用 &ANSWER 也 是 静态 的 。 所 以 在 main 函 数 中 ， 使 用 
&ANSWER 创 建 的 Unstatic 实 例 v 的 生命 周期 也 是 静态 的 。 所 以 ， 在 本 例 
中 ，UnStatic 是 实现 了 Any 的 类 型 。 

代码 第 6 行 定义 了 &&Any 类 型 的 可 变 绑 定 a， 在 第 7 行 可 以 正常 将 &v 
绑 定 给 a， 同 样 在 第 8 行 可 以 正常 调用 is 函 数 来 判断 类 型 。 


12.2 FA 


Rust 中 反射 功能 虽然 有 限 ， 但 除 此 之 外 ，Rust 还 提供 了 功能 强大 的 
Ro (Macro) 来 文 持 元 编程 。 安 是 一 种 批 处 理 的 称谓 ， 通 第 来 说 ， 是 指 
根据 预定 义 的 规则 转换 成 相应 的 输出 。 这 种 转换 过 程 叫 作 安 展开 


(Macro Expansion) 。 
12.2.1 起 源 


现在 很 多 语言 都 提供 了 宏 操 作 ， 大 致 可 以 分 为 两 类 : MAB 和 
语法 扩展 。 

C 语 言 中 的 宏图 数 融 属 于 文本 和 蔡 换 ， 比 如 “ 井 define min (X, Y) 
C (X) < (Y)? X): (Y) ) ”， 当 调用 min (1，2) 时 ， 通 过 预 
处 理 器 将 宏 展 开 之 后 就 会 变 为 “( (1) < (2) ? a): (2) ) ”。 由 
于 C 的 宏 是 纯 文本 伏 换 ， 预 处 理 旧 并 不 会 对 宏 体 做 任何 检查 ， 所 以 使 用 
它 的 时 候 经 常会 出 现 问 题 。 

男 外 一 种 可 以 进行 语法 扩展 的 宏 起 源 于 Lisp 语 言 。Lisp 有 的 宏 可 以 利 
用 S 表 达 式 ”〈S-Expr)〉， 将 代码 作为 数据 ， 生 成 狐 的 代码 ， 而 这 些 代 码 
叉 可 以 被 执行 ， 这 就 赋予 了 Lisp 宏 强大 的 可 能 性 ， 包 括 可 以 由 此 进行 语 
法 扩展 ， 其 至 创造 新 的 语法 。 们 单 来 说 ，Lisp 安 束 是 将 一 个 $ 表 达 去 转 
变 为 另 一 个 $ 表 达 式 。 如 代码 清单 12-11 所 示 。 

代码 清单 12-11: 定义 Lisp 宏 示意 


1. (defmacro one! (var) 

2 (last “setg var 1) 

cr ) 

4 (+ (one! x ) 2) // 调用 one! 
5 (+ (setq x 1) 2) // REF 


6.) 

代码 请 单 12-11 展 示 了 Lisp 语 言 中 的 宏 定 义 。 人 代码 第 1 一 3 行 通 过 
defmacro X. Y Hone! > RIER 4 行 定义 了 一 个 使 用 one! 调用 的 S K 
达 式 ， 该 表达 式 会 通过 宏 展开 ， 将 one! 替换 为 “(setq x 1) ”， 从 而 生 


BMS #eIA TRS (+ Csetqx1) 2) ” 

所 请 S 表 达 式 ， 是 指 人 类 可 读 的 文本 形式 的 一 种 三 元 结构 ， 形 
gi“ (123) ”在 Lisp 语 言 中 既 可 以 作为 代码 ， 也 可 用 作 数 据 。 代 码 清 
单 12-11 中 “ (+ (setq x 1) 2) ” 训 是 一 个 S 表 达 式 。S 表 达 式 实际 上 等 价 
于 本义 树 结构 ， 如 图 12-1 所 示 。 


(+ 
(setq x 1) 
2 





图 12-1: S 表 达 式 等 价 于 二 文 树 
图 12-1 中 展示 了 和 S 表 达 式 等 价 的 二 又 树 结构 ， 其 中 每 个 节点 束 古 5 
表达 式 中 的 元 系 。 当 S 表 达 式 中 存在 宏 的 时 候 ， 束 会 将 其 展开 ， 从 而 让 
ZA AS AIA TUE BOIS AIA. KHER Ne ， 安 调用 和 图 数 
调用 之 间 的 区 别 ， 宏 调用 产生 的 是 $ 表 达 式 ， 而 函数 调用 会 产生 县 体 的 
值 ， 认 清 这 个 区 别 比 较 重 要 。S 表 达 式 是 Lisp 语 言 的 精华 所 在 ， 这 种 思 
想 对 现在 的 很 多 语言 都 影响 颇 深 。 


除 C 语 言 的 文本 蔡 换 宏 外 ， 其 人 现代 编程 语言 中 提供 的 安 都 可 以 通 
过 直接 操作 抽象 语法 树 的 方式 来 进行 语法 扩展 。 不 同 的 语 BHAWAN 
式 有 上 所 不 同 。 有 的 提供 了 显 式 的 安 语 法 ， 比 如 defmacro、macro 等 天 键 
字 来 定义 宏 ， 有 的 语言 则 通过 其 他 形式 ， 比 如 Python 语言 中 的 竣 饰 大 
(decorator) 和 Ruby 中 的 块 (block) ， 均 可 以 达成 操作 抽象 语法 树 的 目 
的 ， 殊 途 同 归 。 而 抽象 语法 树 束 等 价 于 Lisp 中 的 S 表 达 式 ， 用 S 表 达 式 可 
以 表示 任何 语言 的 抽象 语法 树 。 
Rust 也 不 例外 ， 开 及 者 可 以 编写 特定 的 安 ， 在 编译 时 通过 安 展开 的 
方式 操作 抽象 语 法 树 ， 从 而 达到 语法 扩展 的 目的 。 


12.2.2 Rust 中 宏 的 种 类 


Rust 的 宏 系 统 按 定义 的 方式 可 以 分 为 两 大 关 : 

- FS HAZ (Declarative Macro) 

- 过 程 宏 (Procedural Macro) 

声明 宏 是 指 通过 macro_rules! 声明 定义 的 宏 ， 它 是 Rust 中 最 利用 
MZR. SHITE Nightly 版 本 的 Rust 之 下 ， 使 用 # ! 
[feature (decl macro) ] 就 允许 使 用 macro 关 键 字 来 定义 声明 宏 ， 在 不 
远 的 将 来 ，macro 关键 字 会 在 Stable 版 的 Rust 中 稳定 下 来 。 

过 程 宏 是 编译 费 语 法 扩展 的 方式 之 一 。Rust 允 许 通 过 特定 的 语法 编 
写 编译 右 插件， 但 该 编写 插件 的 语法 还 未 稳定 ， 所 以 提供 了 过 程 宏 来 让 
开发 者 实现 自 定义 派生 属性 的 功能 。 比 如 Serde 库 中 实现 的 划 
[derive (Serialize, Deserialize) ] 束 是 基于 过 程 宏 实现 的 。 

具体 到 宏 使 用 的 语法 形式 又 分 为 以 下 两 种 : 

- 调用 宏 ， 形 如 printlIn! . assert_eq! . thread_local! 等 可 以 当 作 
图 数 调 用 的 安 。 这 种 形式 的 宏 通 第 由 声明 宏 来 实现 ， 也 可 以 通过 过 程 宏 
实现 。 

- 属性 宏 > EWU H [derive (Debug) ] 或 #[cfg] 这 种 形式 的 
语法 。 这 种 形式 的 安 可 以 通过 过 程 宏 来 实现 ， 也 可 以 通过 编译 堪 插 件 来 
实现 。 

按 宏 的 来 源 ， 可 以 分 为 以 下 两 类 : 

-AEZ ， 是 指 Rust 本 里 内 置 的 一 些 宏 ， 包 括 两 种 一 种 由 标准 库 
中 上 其 体 的 代码 实现 ， 男 一 种 属于 编译 旧 固有 行为 。 

` 目 定义 宏 ， 是 指 由 开发 者 目 己 定义 的 声明 宏 或 者 过 程 宏 等 。 

代码 清单 12-12 展 示 了 声明 宏 定 义 。 

代码 清单 12-12: 定义 unless! 安 


macro rules! unless { 
(Sarg:expr, Sbranch:expr) => (if !Sarg | Sbranch };); 
} 
rn tmp{a: 132, BE 132) 1 
unless!( a> b, { 
send (“r < Ti ar De 


Ow = OW Oo S WwW NH EF 


fn main() { 
W let. {är B) = (1, 2)? 
bei: cmp ta, BI? 
lZx J 


代 公 清早 12-12 中 使 用 macro rules! X Sunless! HHA, BNA 
需要 理会 代码 第 2 行 所 示 的 具体 代码 是 什么 意思 ， 后 面 会 进行 详细 介 
绍 。 现 在 只 需要 知道 unless! 宏 可 以 在 条 件 为 假 的 情况 下 执行 分 文 代 
Ad, 

FEAR BA ~ 847 EX Sempre, FFV unless! 安 判 新 a 和 b 的 大 
\\, WRAK Fb WET EUR A AGAR ZS TS oe Hag 1 <2”. 

STS A 12-13 AN SESE BE SOUR AE J TEH A. 

Sis 4212-13: (E Ae RAE JB HE BI 

1 # [derive (new) ] 

2 pus struct Foo; 

Bix fn main() { 

4 let x = Foo::new(); 
3 assert eq! (x, Foo); 
Ge f 

代码 清单 12-13 假 定 ”已 经 实现 了 目 定义 派生 属性 new， 可 以 通过 ## 
[derive (new) ] 的 方式 为 结构 体 Foo 在 编译 时 自动 生成 hew 方 法， 如 代 
人 码 第 1 行 和 第 2 行 所 示 。 

在 main 函 数 中 ， 可 以 直接 调用 new 方 法 来 创建 Foo 结 构 体 的 实例 x。 
日 前 可 以 利用 过 程 宏 的 方法 来 日 定义 派生 属性 ， 上 共 体 如 何 实现 ， 在 本 草 
后 面 会 有 详细 介绍 。 


代码 清单 12-14 展 示 了 两 种 内 前 宏 的 定义 。 
代码 清单 12-14: 内 置 宏 展示 
macro rules! stringify { ($($t:tt)*) => ({ /* compiler built-in */ }) } 
macro rules! println { 

3 Wn 

(Sfmt:expr) => (print! (concat! (Sfmt, "\n"))); 

(EWE | SR S(Sargétte)*) => 

(print! (concat! (Sfmt, “\n™"), S{Sargq)*)); 


— NT oH o> ty BO H 


} 
代码 清单 12-14 中 代码 第 1 行 展 示 的 是 stringify! 宏 ， 它 的 作用 是 可 
以 将 任何 代码 转换 为 字符 串 ， 通 过 源码 可 以 看 出 ， 该 宏 的 行为 属于 编 详 
大 内 置 行为 ， 所 以 在 源码 层面 上 并 未 体现 出 具体 的 实现 。 

代码 第 2 一 7 行 是 最 常见 的 printn! 宏 。 看 得 出 来 ， 它 不 属于 编译 器 
内 置 行为 ， 而 属于 标准 库 内 定义 的 声明 宏 ， 其 中 用 到 的 concat! 也 属于 
Sites ABT AWA, m print! 是 另外 一 个 声明 宏 。 

那么 ， 如 何 编写 目 定义 声明 宏 或 过 程 宏 呢 ?声明 宏和 过 程 宏 的 工作 
原理 分 别 是 什么 ?在 寻找 这 两 个 问题 的 答案 之 前 ， 还 需要 先 了解 Rust 代 
AS) ig PELE o 


12.2.3 编译 过 程 


回顾 一 下 Rust 的 整个 编译 过 程 ， 如 图 12-2 所 示 。 


Rust Code 2n, Token 


E 优化 
> LLVM IR * Machine Code 





12-2: Rust 代 人 码 编译 过 程 

Rust 源 码 的 整个 编译 过 程 可 以 大 致 分 为 六 个 主要 阶段 出 : 

1. 分 词 阶 段 ， 通 过 词法 分 析 将 源码 分 为 一 系列 的 词 条 (Token) 。 

2. 解 析 阶 段 ， 通 过 语法 解析 ， 将 词 条 解析 为 抽象 语法 树 CAST) 。 

3. 提 炼 HIR ， 通 过 对 抽象 语法 树 进 一 步 提炼 简化 ， 得 到 高 级 中 间 话 
言 (High-Level IR，HIR)〉， 专 门 用 于 类 型 检查 和 一 些 相 天 的 分 析 工 
作 。HIR 相 比 于 AST， 人 简化 了 语法 信息 ， 因 为 HIR 不 需要 知道 代码 的 语 
UR: 

ASeGKMIR ， 通 过 对 HIR 的 再 次 提 烧 ， 别 除 一 些 不 必要 的 元 系 之 后 
得 到 中 级 中 间 语 言 (Middle-Level IR, MIR) ， 专 门 用 于 检查 以 及 其 他 
的 优化 工作 ， 比 如 支持 增 量 编译 等 。 

5. 转 详 为 LLVM IR ， 将 MIR 转 详 生 成 为 LLVM IR 语言 ， 交 由 
LLVM 去 做 后 续 处 理 。 

6. 生 成 机 右 码 ， 将 LLVM IR 经 过 一 系列 的 优化 生成 机 器 码 (.0) X 
件 ， 最 终 交 给 链接 右 处 理 。 

以 上 工作 均 由 Rust 编 译 占 来 完成 ， 不 同 的 阶段 使 用 了 不 同 的 内 部 组 
件 ， 并 且 不 同 的 编译 阶段 有 不 同 的 工作 目标 。 现 在 只 关注 与 宏 系统 相关 
的 分 词 和 解析 。 

词 条 流 

Rnust 代 码 编译 的 第 一 步 ， 就 是 通过 词法 分 析 把 代码 文本 分 词 为 一 系 
MAI (Tokens) ， 以 代码 清单 12-15 中 的 普通 函数 作为 示例 来 看 词 
法 分 析 如 何 分 词 。 

代码 清单 12-15: 普通 函数 示例 


1 fn Ela: = 1321 
Bu L 十 2 

Sis } 

4 fn main() { 

5 EL 

6 } 


可 以 将 代码 清单 12-15 中 的 代码 保存 为 一 个 Rust 文 件 ， 假 定 


是 main.rs 文件 。 亦 或 是 使 用 Cargo 生成 一 个 二 进 制 crate 项 目 ， 将 上 面 
的 代码 放 到 src/main.rs 文件 中 。 当 使 用 rustc mian.rs 或 cargo build 命令 
编译 时 ， 编 详 器 就 会 找 之 前 所 述 的 流程 对 代 但 进行 处 理 。 
词 条 一 般 包 括 以 下 几 类 : 
:标识 符 ， 源 码 中 的 关键 字 、 变 量 等 都 将 被 识别 为 标识 符 。 
` 字面 量 ， 比 如 字符 串 字 面 量 。 
运算 符 ， 比 如 加 、 减 、 乘 、 除 、 逻 辑 运 算 符 等 。 
FRG, Mos, HS. AS. BS. eth Ss. ak. 
VR APPR, Fae A SAKURA. fn 关键 
字 会 被 识别 为 一 个 标识 符 〈Identifier) ， 函 数 名 t 同 样 也 是 一 个 标识 符 。 
当 磁 到 圆 括号 的 时 候 ， 编 译 右 会 以 圆 括 写 为 内 ， 将 其 看 作 一 个 独立 的 组 
er ET OP} ta] ADT. PRB EH TRIKE A sk C>) 也 会 被 识别 为 
一 个 独立 的 界 符 词 条 ， 返 回 值 类 型 i32 同样 也 是 一 个 标识 符 。 最 后 的 函 
数 体会 以 化 括号 为 界 ， 作 为 一 个 独立 的 组 合 进行 分 词 处 理 。 
通过 编译 融 提 供 的 命令 可 以 但 看 代码 清单 12-15 生 成 的 词 条 和 抽象 
语法 树 信 息 ， 如 代码 清单 12-16 所 示 。 
代码 清单 12-16: 输出 语法 树 的 rustc 命 令 
// 假如 是 单独 的 文件 执行 此 命令 
9 
// 假如 是 cargo 生成 的 二 进 制 包 执行 此 命令 
$ cargo rustc -- -Z ast-json 
该 命令 会 生成 JSON 格 式 的 AST 信 息 ， 其 中 包含 了 词法 分 析 之 后 的 
词 条 信息 和 抽象 语法 树 信 息 。 图 12-3 展 示 了 从 JSON 信 息 中 提取 到 的 词 


条 信息 。 


fn t(1: 132) -> 132{ 
l +2 


} 


nl— ft] l — e — ej — e 


Ident Ident Parer RArrow Ident Broce 
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Ident Colon Ident Ident Binip Integer 





图 12-3: 词 条 信息 示意 

图 12-3 展 示 了 经 过 词法 分 析 后 函数 t 的 词 条 信息 。 看 得 出 来 ， 代 码 中 
的 空格 换行 已 经 科技 并 ， 天 键 字 等 各 种 语法 元 对 已 经 航 识 别 为 单独 的 词 
Re. FERC PK Ba EA HA RAB, PRA AT. WRR F 
编译 器 后 续 生 成 抽象 语法 树 来 说 意义 重大 。 

抽象 语法 树 

词 条 流 虽然 可 以 区 分 标识 符 、 括 号 或 箭头 等 其 他 语法 元 素 ， 但 本 身 
并 不 携 珊 任何 语法 信息 ， 必 须 经 过 语法 解析 阶段 ， 生 成 抽象 语法 树 ， 编 
详 基 才能 最 终 识 别 Rust 代 人 码 的 意义 。 

代码 清单 12-17 展 示 了 夯 外 一 个 较 复 杂 的 示例 。 

代码 清单 12-17: 男 外 一 个 较 复 淋 的 示例 


1. fn main() 1 


Dn let fa, De Cp d e) = (1, 2, 3 [4, 5ļlə 6); 
ae a+b+ (c+d[0] ) + e; 
a. } 


代码 清单 12-17 定 义 了 多 个 变量 ， 代 码 第 3 行 对 多 个 变量 进行 求 和 。 
之 所 以 称 其 为 “复杂 的 示例 ”， 是 因为 该 示例 生成 的 抽象 语法 树 比 代码 清 
单 12-15 中 的 复杂 。 

图 12-4 展 示 了 代码 第 3 行 编 详 后 产生 的 抽象 语法 树 结 构 示 音 。 


[Binary: Add) 


fn maint) { 


J \ 
ee ae Binary: “et Path: e 
| Paren | 
Fi Add | ‘son Add ] i 


} 


maa a En | fencer c| in 
‘Identifier: d ‘a Int: 0 


412-4: 抽象 语法 树 示意 
图 12-4 展 示 的 抽象 语法 树 可 以 用 S$ 表 达 式 表示 ， 如 代 但 清单 12-18 所 








不 。 
IRIDA 412-18: 用 S 表 达 式 来 表示 抽象 语法 树 


1. //a+b+ (c+d[0] ) te 
a ( 

Er + 

4. ( 

Da + 

6. (+ ab ) 

Ta (+ © (index d Q) ) 
om ) 

Da e 

LO« 3 


EEREN, Sa Peas at A WA see RR RARA P ee a 
Wiis. PERK Beth vom Atay WoT ZARA Ye, Lh 
如 ， 节 点 中 如 果 包 含 了 宏 ， 则 继续 将 其 展开 为 抽象 语法 树 ， 和 直到 最 终 节 
点 中 不 包含 任何 宏 为 止 。 

12.2.4 声明 安 


声明 宏 是 Rust 语 言 中 最 常用 的 宏 ， 它 可 以 通过 macro_rules! 来 创 


建 ， 它 有 时 也 被 称 为 “示例 安 (Macro by example, MBE) ”. 
Fa HA EN cE A RP E 
使 用 macro_rules! 定义 声明 宏 ， 基 本 满足 如 代码 清单 12-19 所 示 的 
格式 。 
代 但 清单 12-19: macro_rules! 定义 声明 宏 的 格式 示意 


1 macro rules! Sname { 
2 SruleoO ; 

: Srulel ; 

4 oe us 

5 SruleNn ; 


6 . } 
代码 清单 12-19 是 伪 代 公示 意 \ BN 其 中 $name 表示 宏 的 名 他， $rule0 
到 $ruleN 表示 NN 个 宏 要 [匹配 的 规则 。 其 中 每 个 规则 也 有 国定 的 格式 ， 如 
代码 清单 12-20 所 示 。 
代码 清单 12-20: 声明 宏 中 每 个 岂 配 规则 要 满足 的 格式 示意 


( Spattern ) => ( Sexpansion ) 


代码 清单 12-20 中 ，$pattern 代表 每 个 匹配 规则 的 模式 ，$expansion 
代表 与 模式 相应 的 展开 代码 。 以 之 前 代码 清 和 早 12-12 中 出 现 过 的 
unless! ” 宏 定义 来 说 ， 罗 配 模式 为 “($arg: expr, $branch: expr) ”, 
展开 代码 是 “(if! $arg{$branch}; ) ”。 声 明 宏 中 定义 的 规则 也 属于 一 
种 类 似 于 match 的 模式 匹配 。 

PU ACHES A “Sarg: expr 这 种 格式 为 声明 宏 定 义 中 的 通用 格 
式 。$arg 为 捕获 变量 ， 可 以 目 由 命名 ， 但 必须 以 "$?" 字 符 开 头 。 冒 号 后 
面 的 叫 捕获 类 型 ， 在 该 示例 中 expr 对 应 于 宏 解 析 器 解析 生成 之 后 词 条 
Ra, FERIA TL. 

展开 代码 中 包含 了 捕获 变量 $arg 和 $branch， 表 示 在 宏 规则 匹配 成 功 
之 后 ， 将 捕获 到 的 变量 的 内 容 答 换 到 相应 的 位 置 ， 从 而 达到 生成 代码 的 
目的 。 

代码 清早 12-21 继 续 沿 用 Sunless! HEX. 

代码 清单 12-21: unless 宏 定义 示例 


macro rules! unless { 
(Sarg:expr, Sbranch:expr) => (if !Sarg | Sbranch };); 
} 


fn main() { 
let (a, BY = (1, 2); 
unless!( a> b, { 
D= g 


PE 


O Ons HD OF SP W e F 


} 

可 以 将 代码 清单 12-21 中 的 代码 保存 为 Rust 文 件 ， 比 如 main.rs。 然 后 

对 其 进行 编译 ， 即 可 得 到 宏 展 开 后 的 代码 ， 如 代码 清单 12-22 所 示 。 
Sis 12-22: 输出 宏 展开 后 代 公 的 编译 名 命 令 

1. // 假如 是 单独 的 文件 则 执行 此 命令 

2 5 rustc -Z unstable-options --pretty=expanded main.rs 

3. // 假如 是 cargo 生成 的 二 进 制 包 则 执行 此 命令 

4 S$ cargo rustc == -Z unstable-options --pretty=expanded 

7e RFP Ja BAS I IS 12-23 APN 

代码 清单 12-23: 安 展开 后 的 代码 


1. fn main() { 


2 let ta, bb = C1, Zh; 
Sa if l(a > b) { i b = as } jẹ 
4. } 


宏 展开 的 过 程 如 图 12-5 所 示 。 


($arg:expr, $branch: expr) =>  ( if! $arg{ $branch };); 


if! (a>b){{b-a;} } | 


: $arg $branch 





图 12-5: 宏 展 开 过 程 示 意 

代码 清单 12-21 中 第 6 一 8 行 unless! 宏 调用 的 展开 过 程 如 图 12-5 所 
示 。 看 得 出 来 ，unless! 宏 调 用 之 时 ， 爷 根据 宏 定义 中 火箭 符 (=>) £ 
侧 的 模式 进行 匹配 ， 然 后 根据 匹配 之 后 捕获 的 结果 对 火箭 符 右 侧 的 展开 
代码 进行 谷 换 。 这 个 匹配 和 将 换 的 过 程 束 是 宏 展开 ， 整 个 过 程 发 生 在 语 
法 解析 阶段 。 

实际 上 ， 编 诺 堪 内 部 有 两 个 解析 需 ， 一 个 是 通用 解析 需 Normal 
Parser) ， 男 一 个 是 宏 解 析 器 (Macro Parser) 。 通 用 解析 器 用 于 处 理 大 
部 分 词 条 流 进 一 步 生 成 抽象 语法 树 ， 但 是 在 页 到 宏 调用 时 则 会 跳 过 ， 并 
不 对 宏 调 用 进行 任何 处 理 ， 反 而 会 在 抽象 语法 树 中 你 留 宏 调用 市 点 。 然 
后 ， 宏 解析 占 会 将 这 些 宏 调用 节点 展开 为 正常 的 抽象 语法 树 节 点 ， 如 图 
12-6 所 示 。 


normal parser 


| 


= 
J N Per macro expansion . 


Law Gt = 


12-6: RANT art Ze H RIP A IE AST ae 
图 12-6 以 unless! 宏 调 用 为 例 ， 首 先 经 过 通用 解析 器 解析 完整 个 模 
块 中 的 代码 ， 但 是 只 保留 unless! 宏 调 用 节点 ， 没 有 对 它 进 行 处 理 。 然 
A 宏 解析 器 会 将 unless! 宏 调 用 节点 进一步 展开 为 正常 的 抽象 语法 树 节 


oO 


声明 宏 的 工作 机 制 
宏 解析 器 的 工作 机 制 大 概 等 价 于 代码 清单 12-24 所 示 的 函数 签名 。 
代码 清单 12-24: 宏 解 析 器 工作 机 制 等 价 的 函数 签名 示意 


l. in macro parser ( 





EM sess: ParserSession, 
Se tts: TokenStream, 
4. ms: &[TokenTree] 

Ja ) -> NamedParseResult 


代码 清单 12-24 中 的 函数 签名 macro_parser 定 义 了 三 个 参数 : 

sess ， 代 表 解 析 会 话 ， 用 于 跟踪 一 些 元 数据 ， 包 括 错 误 信 息 等 。 
tts ， 代 表 词 条 流 (TokenStreaam) ， 是 词 条 序列 的 抽象 表示 。 

“ms ， 代 表 匹 配 硕 ， 代 表 一 组 词 条 树 结 构 。 


男 一 方面 ，macro_rules! AD te PHA, RAW CE Sn ES 
内 部 A 所 定义 。 它 定义 了 一 种 声明 宏 的 通用 解析 模式 ， 形 如 代码 清单 
12-24 所 示 。 

代码 清单 12-24: 宏 定 义 通 用 模式 示意 

(Slhsttti => (Sehsitt } y+ 


Hittin, “4 ARNT ASL macro_rules! 定义 的 声明 宏 时 ， 它 会 使 
用 这 个 模式 来 解析 该 声明 宏 ， 将 安定 义 中 火 季 人 符 左 右 两 侧 都 解析 为 tt ， 
即 词 条 树 ”。 然 后 ， 宏 解析 器 会 将 左右 两 人 出 的 词 条 树 保 存 起 来 作为 宏 调 
用 的 匹配 郝 Gms) 。 结 尾 的 “+? 代 表 访 模式 可 以 是 一 个 或 多 个 。 

当 宏 解析 需 健 到 安 调 用 时 ， 首 先 会 将 安 调 用 中 的 具体 参数 解析 为 词 
条 流 Cts) ， 然 后 在 之 前 保存 的 匹配 右 Gms) 中 取 左 侧 的 词 条 树 
($lhs) 来 匹配 该 词 条 流 。 对 于 代码 清早 12-21 中 unless! 宏 调用 的 示例 
来 说 ， 其 调用 参数 “ Ca>b, {b-a; D "REM SEM Aa Aut 
(tts) MIZE XA“ C$arg: expr, $Sbranch: expr) ”生成 的 词 条 树 进行 
PUM, mA, “a > b” 匹 配 到 “$arg: expr”, “{b-a; 六 匹配 到 <“$branch: 
expr”。 然 后 通过 捕获 变量 $arg 和 $branch 蔡 换 匹 配器 Gms) 中 右 侧 的 词 
条 树 C$rhs) 上 相应 的 代码 ， 和 蔡 换 后 的 $rhs 词 条 树 将 生成 最 终 的 代码 。 

这 束 是 宏 解析 人 右 展开 声明 宏 的 全 过 程 ， 整 个 过 程 和 正则 表达 式 的 工 
ENLAZ. DORA (ms) 相当 于 正则 表达 式 中 的 模式 ， 而 宏 调 用 参数 
生成 的 词 条 流 则 相当 于 正则 表达 式 待 匹配 的 字符 串 。 其 至 ， 宏 定义 中 规 
则 的 模式 是 可 以 像 正 则 表达 式 那 样 使 用 元 符 “+” 或 “*” 来 指定 香 复 的 ， 分 
列 代 表 重 复 一 次 或 一 次 以 上 。 

Bi TD AY) AN FP At, Ss A ik EB a bh SN TL, Z 
RANT as Mle BUI RES ARERR RER BSAA P AAE 
VA (ATA ECE RE, Sm PES A S AERAR Ee tk 
EEF RA, BREW BORER HTA, Wem PES ek. FF 
Ree th By Da exe H! [recursion limit=" ... " ] 属性 来 修改 包 内 允许 
tN) He ES EFT RAED 

正明 宏 中 可 以 捕获 的 类 型 不 仅仅 是 表达 去 Cexpr) ， 以 下 是 捕获 类 
型 列表 。 

item  ， 代 表 语 言 项 ， 了 驶 是 组 成 一 个 Rust 包 的 基本 单位 ， 比 如 模 


Be. FEHR. RIGE, KWEL AARE, impp SHS. 

‘block , RERE, Hiet SIRENS. 

‘stmt, RRRA, REJ ID 5 AER. 

“ expr ， 指 代表 达 式 ， 会 生成 上 其 体 的 值 。 

` pat ， 指 代 模 式 。 

‘ty, RIRA, 

-ident ， 指 代 标 识 符 。 

. path ， 指 代 路 径 ， 比 如 foo、std: : iter 等 。 

‘meta, Jia, RPAAERL.. JH! [...] 属 性 内 的 信息 。 

:tt ，TokenTree 的 缩写 ， 指 代词 条 树 。 

-Vis ， 指 代 可 见 性 ， 比 如 pub。 

‘lifetime ， 指 代 生 命 周期 参数 。 

在 写 抽 明 宏 规则 的 时 候 ， 要 注意 这 些 捕获 类 型 岂 配 的 沁 围 。 比 如 tt 
类 型 ， 代 表 词 条 树 ， 丈 比 expr 能 匹配 的 范围 要 广 ， 需 要 根据 具体 的 情况 
来 选择 。 只 有 了 解 声 明 宏 的 规则 及 其 工作 机 制 之 后 ， 才 可 以 坚 无 障 但 地 
编 与 声明 安 。 

再 明 宏 的 实现 技巧 

接 下 来 ， 以 一 个 具体 的 示例 来 说 明 实 现 声 明 宏 过 程 中 需要 注意 的 地 
方 。Rust 中 初始 化 一 个 HashMap 写 起 来 比较 烦琐 ， 现 在 通过 实现 一 个 宏 
来 简化 这 个 过 程 。 如 代码 清单 12-25 所 示 。 

代码 清单 12-25: hashmap! 宏 用 法 示意 


1. fn main() { 


2 let map = hashmap! { 

3 "a" => 1, 

4. Mp” => 2y 

5 }; 

6 assert eq! (map["a"], 1); 


Ta } 
代码 清单 12-25 展 示 了 hashmap! 安 的 最 终 用 法 ， 看 上 去 非常 简单 且 
直观 。 这 也 是 创建 一 个 声明 宏 的 第 一 步 ， 先 确定 它 将 来 要 使 用 的 形式 。 


fe ROR UM {Hy SHIA WE? 

首先 ， 匹 配 “key=>value” 这 样 的 定义 格式 。 按 照 声明 宏 的 语法 规 
则 ， 首 先 能 想到 的 匹配 模式 束 古 “$key: expr=> $value: expr”, ME key 
还 是 value， 在 Rust 里 至 少 是 一 个 表达 式 。 但 是 ， 这 样 的 键 值 对 可 能 不 止 
一 对 ， 而 且 数 目 是 无 法 确定 的 。 这 就 要 求 由 配 模 式 可 以 午 复 多 配 ， 和 到 
i, RusthH 4A Ze sc Fy HS VLA 

声明 宏 重 复 匹 配 的 格式 是 中 C...) sep rep”， 具体 说 明 如 下 : 

‘$C... ， 代 表 要 把 重复 匹配 的 模式 置 于 其 中 。 

sep , ROEF. BHIES (，) 、 分 号 G ) Mk C= 

>) 。 这 个 分 阳 符 可 依据 其 体 的 情况 省 略 。 

-rep ， 代 表 控 制 重 复 次 数 的 标记 ， 目 前 支持 两 种 : BS CH) 和 加 
号 〈+) ， 人 代表 的 意义 和 正则 表达 式 中 的 一 致 ， 分 别 是 “重复 零 次 及 以 
上 ”和 “重复 一 次 及 以 上 ”。 

那么 ， 根 据 这 样 的 规则 ， 之 前 的 匹配 模式 束 改 进 为 “$ ($key: 
expr=>$value: expr) ，*”， 中 辐 的 分 隅 从 用 了 有 逗号， 这 是 因为 每 个 刍 
EX asa “Ma Stk Tah, SAA AE Soph, ZA TB 
法 可 以 目 由 设计 o “A ANB PPE AS oP i o 

到 此 ， 可 以 写 出 第 一 版 hashmap! 宏 ， 如 代码 清单 12-26 所 示 。 

代码 清单 12-26: hashmap! 宏 的 实现 


lL. Macro rules! hashmap { 


2. ($(Skey:expr => Svalue:expr),* ) => { 
co { 
4. let mut map = ::std::collections::HashMap: :new(); 
5 5 ( 
6. _map.insert ($key, $value); 
Ts p% 
Sis map 
9 . } 
10. by 
Lin J 


在 代码 清单 12-26 中 ， 人 代码 第 2 行使 用 了 “9 ($key: expr=> $value: 


expr) » WIRA PRICE ADS Ea — 47 BEET IN te, A BEDE ACI A 
Sake Tai. DLAC EA 12-7 ATA . 


$C $key:expr => $value:expr) 
hashmap! { | 


os => 1 , 
a mii 2 a 
} 





图 12-7: hashmap! 宏 匹 配 过 程 示 意 

代码 第 4 行 在 生成 代码 中 定义 一 个 空 的 HashMap 实 例 _map。 注 总 ， 
这 里 使 用 了 绝对 路 径 : : std: : collections: : HashMap， 这 也 是 一 个 
技巧 ， 可 以 避免 冲突 。 

代码 第 5 一 7 行 与 匹配 模式 中 的 重复 格式 相对 应 ， 也 使 用 “$《〈.…) 
*2 格 式 ， 不 同 点 在 于 不 需要 分 隔 和 侍卫 。 在 _map 里 插入 键 值 对 ， 也 需要 根 
据 匹 配 捕获 的 键 但 对 重复 插入 。 

最 终 hashmap! 安 调 用 展开 的 结果 如 代码 清单 12-27 所 示 。 

代码 清单 12-27: hashmap! 调用 展开 后 代码 示意 


1 iet mut map = :istd: :collections: :HashMap: mew () ; 
2 _mMap.insert("a", 1); 

3. Map.insertE("b", 2); 

4 map 


代码 清单 12-27 中 展示 的 正 是 预料 中 的 代码 。 但 是 目前 该 宏 偿 有 一 
个 问题 ， 束 是 在 调用 的 时 候 ， 了 最 后 一 个 键 值 对 加 上 逗号 时 ， 顷 详 融 会 出 
错 。 之 前 最 后 的 键 值 对 没有 去 号 的 时 候 ， 匹 配 模式 匹配 完 该 键 信 对 融会 
ESAR, (AEDES Ss, SVMS SZ Ja, Wes geese 
匹配 星 亏 ， 从 而 激活 重复 匹配 ， 但 此 时 后 续 已 经 没有 键 信 对 供 其 匹配 
了 。 所 以 会 报错 ， 编 译 器 宣告 该 宏章 外 结 

解决 这 个 错误 有 两 种 办 法 ， 第 一 种 束 古 利用 宏 的 递归 调用 ， 将 最 后 


ATA SBA, OMS 5 12-28 fT AN 6 
代码 清单 12-28: hashmap! HAV AYR Aaa EO 25 ee y 


1. macro rules! hashmap { 


< ($(Skey:expr => Svalue:expr,)*) => 
ce { hashmap! ($(Skey => Svalue),*) }; 
4 (S$(Skey:expr => Svalue:expr),* ) => { 
5 { 

6 let. mut map = tistad: collections i :HashMap: :new() ; 

7. > ( 

Bis _map.insert ($key, $value); 

9 u% 

10. map 

i } 

12; ie 

Lee | 


代码 清单 12-28 中 第 2 行 是 新 添加 的 一 条 匹配 规则 ， 注 意 其 还 侧 的 
匹配 规则 为 “'$ ($key: expr=> $value: expr, ) *”, iS 7EVL ACRE 
面 ， 而 右 侧 递归 调用 了 hashmap! 宏 。 所 以 ， 访 行规 则 经 过 “hashmap! 
($ ($key=>$value) , *) ”匹配 之 后 ， 实 际 上 会 将 “hashmap! ("a 
=>1, "b"=>2, ) 和 丛 换 为 中 ashmap! ("a"=>1, "b"=>2)”, 
再 次 调用 hashmap! 的 时 候 就 会 和 代码 清单 12-27 一 样 直接 匹配 第 二 条 规 
I Æ KARIE 

另外 一 种 方法 更 简单 了 ， 只 需要 利用 重复 匹配 的 拉 巧 即 可 ， 如 代 但 
清单 12-29 所 示 。 

代码 清单 12-29: AH ER OAC ORL AC a a 


1. macro rules! hashmap { 

2 ($(Skey:expr => Svalue:expr),* $(,)*) => { 
3 { 

4. let. mut map = pistar recollections: nsna snes 
Bis 2 ( 

6 map.insert ($key, $value); 

7 ) 之 

8 map 

9. } 

LO, } 

tig j 


代码 消音 12-29 中 ， 在 之 前 匹配 模式 “$ ($key: expr=> $value: 
expr, ) ”的 基础 上 , 增加 了 “$(，) +”, 下 为 “$ ($key: expr=> 
$value: expr, ) *$ G, ) 六。 这 样 殴 可 以 同时 匹配 最 后 键 值 对 结尾 是 
Az Ss WTA UL 

这 下 hashmap! 安 残 可 以 正 彰 使 用 了 上 了， 但 它 还 有 改进 空间 。 假 如 要 
在 创建 HashMap 的 时 候 根据 给 定 键 值 对 的 个 数 来 预 分 配 容量 ， 访 如 何 
修改 ? 

首要 的 问题 承 是 要 计算 出 键 什 对 的 个 数 。 只 需要 想 办 法 生成 如 代码 
清单 12-30 所 示 的 代码 即 可 。 

代码 清单 12-30: 生成 代码 示意 


:deb gap = WL,J>relenle lAls MID 
2. det mut map = HashMap::with capacity( cap); 


代码 清单 12-30 中 ， 是 想 利 用 len 方法 来 计算 传 入 键 值 对 的 个 数 ， 
知道 个 数 以 后 束 可 以 使 用 HashMap 失 with_capacity 方 法 来 预 分 配 容 量 。 
因为 len 方 法 是 [] 关 型 实现 的 方法 ， 所 以 可 以 通过 “<[ O J>: : 
len 〈&[..]) ”这 样 的 形式 来 调用 。 这 里 借用 了 “[ O 了 类 型 来 辅助 计算 键 
值 对 的 个 数 ， 其 实 也 可 以 使 用 其 他 类 型 ， 比 如 String 字符 串 ， 但 是 这 里 
用 单元 类 型 “〈) ”的 好 处 是 不 占用 空间 。 

接 下 来 的 问题 就 是 ， 如 何 构 造 这 个 用 于 辅助 计算 键 值 对 个 数 
IE OC) ]” 类 型 数组 。 基 本 思路 如 图 12-8 所 示 。 





图 12-8: 将 给 定 的 键 值 对 符 换 为 指定 单元 值 数 组 过 程 示意 

图 12-8 示 意 的 思路 如 下 : 

` 通过 区 配 输入 的 键 值 对 ， 得 到 所 有 的 键 。 

:将 所 有 的 键 通 过 匹配 符 换 为 单元 值 。 

:生成 最 终 预 期 的 代码 。 

这 里 需要 匹配 两 次 ， 意 味 看 可 以 通过 创建 两 个 不 同 的 宏 来 完成 需 
求 。 如 代码 清单 12-31 所 示 。 

代码 清单 12-31:， 可 根据 键 值 对 个 数 预 分 配 的 hashmap! 安 


L. Madro rules! nat { 

Zs (P (SmrGt)*) => (0)? 

dy J 

a, MADO TULISS: COUTE 4 

DA (S(Skey:expr),*) => (<[()]>::len(&[$ (unit! (Skey)),*])); 
Gs ] 

7» macro rules! hashmap { 

8 . ($(Skey:expr => $value:expr),* $(,)*) => { 
9. { 

Lo. let cap = count! ($ ($key) ,*); 

i let mut map 

12; = pista collections: HashMap swith capacity! cap); 
18. > ( 

14. _map.insert ($key, $value) ; 

LB. E 

16% map 

y i } 

18. ri 

lje 3 

ZU. IH, fain) 4 

‘ie let map = hashmap! { 

BA "a" => 1, 

AP ey" = a 

24 E 

2D s assert, 6g. mpl ea], 137 

Ga | 


代码 清单 12-31 中 义 定 义 了 两 个 宏 unit! 和 count! ， 借 助 这 两 个 宏 来 
完成 图 12-8 所 示 的 蔡 换 过 程 。 有 具体 的 宏 规 则 匹配 过 程 如 图 12-9 所 示 。 


($($key: expr), *) 


a. ee 
MQ" mn 1, "h" _ 2 :~ "a", 


($($x:tt)*) 





12-9: unit! 和 count! 宏 规则 匹配 示意 
代码 清单 12-31 虽然 完成 了 预定 的 目标 ， 但 是 引入 了 为 外 两 个 宏 。 
这 就 叶 任 目标 宏 hashmap! 依赖 于 两 个 独立 的 宏 ， 如 果 以 后 想 把 
hashmap! 宏 放 到 独 了 并 的 包 (crate〉 中 对 外 公开 ， 那 依赖 的 这 两 个 独立 
的 宏 也 必须 公开 ,但 是 这 两 个 宏 对 外 部 来 说 ， 基 本 没有 其 他 作用 。 如 何 
解决 这 个 问题 呢 ? 答案 很 简单 ， 只 需要 把 依赖 的 两 个 宏 转 移 a 到 
hashmap ! Ses ATE HP AR 即 可 ， 如 代码 12-32 上 所 示 。 


代码 清单 12-32: fEhashmap! 宏 内 部 定义 依赖 宏 


Le Macro rules: ash q 

2 (Gunite S(Sxrte)*) => (0): 

3 (@count $(Srest:expr),*) => 

4 (<[()]>::len(&[$ (hashmap! (Cunit Srest)),*])); 
6, ($(Skey:expr => S$value:expr),* $(,)*) => { 

6 { 

7 let cap = hashmap! (@count $($key),*); 

8 let mut map = 

9. Fi btatCollecrlions: sHasiMapitwlth capacity ( cap) ; 
10 > ( 

Lia -Map.insert ($key, $value); 

lgs j3 

Le map 

14. } 

LBs F 


注意 代码 清单 12-32 中 第 2 一 4 行 ， 分 别 把 unit! 宏和 count! 宏 的 定义 
移 到 了 hashmap! 安定 义 内 部 ， 并 且 这 里 利用 了 安 递 归 调 用 的 特性 。 在 
代码 第 7 行 ， 当 hashmap! 安 调 用 第 一 次 匹配 时 ， 内 部 规则 允 会 被 激活 ， 
ZEIT THA HR, mw ERM A EMRI 

其 中 “@unit* 和 “@count” 相 当 于 是 内 部 宏 规 则 的 宏 名 ， 暂 且 称 之 为 
内 部 宏 局 | 。 内 部 宏 的 名 字 必 须 放 到 真正 的 匹配 规则 之 前 ， 否 则 编译 器 
会 将 其 当 作 普通 的 匹配 规则 去 处 理 。 内 部 宏 的 名 字 并 非 必 须 用 “@” 和 从 号 
开头 ， 它 只 是 一 种 社区 惯用 法 。 你 可 以 使 用 “unit” 或 “unit! ”命名 。 

Val 

调试 宏 代 码 基 本 有 两 种 办 法 : 

使 用 编译 问 命 令 来 输出 展开 后 的 代码 ， 如 代码 清单 12-32 所 示 。 

在 Nightly 版 本 下 使 用 #! [feature (trace_macros) ] 属 性 来 跟踪 安 

展开 过 程 。 

代码 清单 12-33 展 示 了 如 何 给 代码 清单 12-32 中 定义 的 hashmap! ER 
蹊 宏 展开 过 程 。 

代码 清单 12-33: 调试 hashmap! 安 


l. #![feature(trace macros) ] 

2 macro rules! hashmap { 

3 (UNIT G(R tt) *) => 40) 2 

4 (@count $(S$key:expr),*) => 

2 (<[()]>::len(&[$(hashmap! (@unit S$key)),*])); 
6 (S(Skey:expr => Svalue:expr),* $(,)*) => ({ 
7 let cap = hashmap! (count! $(Skey),*); 

8 let mut map = 

9. Eo igollections i ¢hashMapi¢with capacity ( cap); 
ti, 2 ( 

diel map.insert ($key, $value); 

Le j% 

LB 。 map 

14. ar 

Loe g 

Laks: Le, Mess 4 

lend 可 ECG Macros! (LOUE) ; 

LS a let map = hashmap! { 

19. "a" => 1; 

20. "Ht => 2 

fle pi 

Bow | 


AVA 12-3344 AA  H#! [feature (trace macros) ] 属 性 ， 注 意 此 
BY ANEH Nightlyh As Rust7 sega. FETS 1777 He 
hashmap! 宏 调用 的 上 方 ， 加 上 trace_macros! (true) 就 可 以 调试 宏 展 
开 过 程 。 

纺 详 结果 如 代码 清单 12-34 所 示 。 

代码 清单 12-34: 编译 输出 hashmap! 宏 调试 信息 


note: trace macro 


= note: expanding hashmap! { "a" => 1, "b" => 2, } 


note: to { 
let Gap = fesimap 1 | murt t “a” » “eB” ) 2 


Let MUL Tap = Sista eeollections 8 HasiMap z! With Capacity | Sap) j 


tap. imsert. [ "amp dpi 
Map + imsert i "bp", 2) 7 p] 
= note: expanding ‘hashmap! { count ! "a" p "b" }- 
= note: to “< [ ( ) ] > &: len ( 

c | ashmag | { teak | Mar J , hospmas ! | ‘ame ! BP yy TI 

= note: expanding ‘hashmap! { unit ! "a" } 
= note: to ( )` 
= note: expanding ‘hashmap! { unit ! "b" }. 
= note: to ( ) 


代码 消 日 12-34 展 示 了 编译 过 程 中 输出 的 调试 信息 ， 完 整地 展示 了 
hashmap! 安 的 展开 过 程 。 除 trace_macros! 宏 外 ， 还 有 其 他 的 宏 调试 方 
法 。 限 于 篇 幅 ， 这 里 不 再 展开 介绍 。 

:es 

声明 宏 在 展开 后 ， 不 会 污染 原来 的 词法 作用 域 ， 具 有 这 种 特性 的 宏 
叫 卫 生 宏 (Hygienic Macro) 。Rust 的 声明 宏 具 有 部 分 卫生 性 ， 如 代码 
清单 12-35 所 示 。 

iis 12-35: 展示 声明 宏 的 卫生 性 
macro rules! sum 4 

(Se:expr) => ({ 

let a = 2; 
Se +a 
}) 
} 
fn main() { 


let four = sum! (a); 


O OANA HD OO SP W ND F 


代码 清单 12-35 如 果 编 译 ， 会 报错 ， 如 代码 清单 12-36 所 未 。 
代码 清单 12-36: 错误 信息 
error[E0425]: cannot find value ‘a’ in this scope 
--> src/main.rs:8:22 
| 
S| let four = sum! (a); 
| = NOt ound 2h. this scope 
Mais 12-36 的 错误 信息 提示 ， 在 当前 作用 域 找 不 到 变量 an Fil 
AHP, sum! 宏 如 果 展 开 以 后 ， 会 有 一 个 变量 a 的 定义 ， 如 代码 清单 12- 
37 AIT AR © 
代码 清单 12-37: 假想 中 sum! 展开 后 的 代码 


1 fn main() { 

2 let four = { 
EP let a = 2; 
4 ata 

5 bi 


6. } 

事实 上 ， 声 明 宏 展开 以 后 的 代码 拥有 独立 的 作用 域 ， 并 不 会 污染 当 
亲 宏 调用 的 作用 域 。 所 以 Rust 编 译 占 会 报 找 不 到 变量 a 的 错误 。 这 束 体 
HL Y Rust 8A AY AE PE 

目前 Rust 声明 宏 的 卫生 性 并 不 完整 ， 只 有 对 变量 和 标签 (比如 循环 
外 部 的 标签 ”out) 可 以 保证 卫生 。 像 生命 周期 、 类 型 等 都 无 法 保证 卫 
生性 ， 所 以 在 写 宏 的 时 候 ， 需 要 注意 ， 在 安里 如 果 使 用 非 当 前 作用 域内 
定义 的 变量 ， 一 定 要 用 绝对 路 径 ， 并 且 这 些 变量 必须 在 使 用 安 的 任何 地 
方 都 可 见 。 在 宏 的 卫生 性 方面 ，Rust 还 在 逐渐 完 闭 。 

导入 /导出 

在 日 党 开发 中 ， 经 常会 将 一 些 和 常用 的 宏 打 包 起 来 方便 使 用 ， 从 而 所 
高 开 友 效率。 比如， 可 以 将 hashmap! 宏 打 包 起 来 。 为 了 演示 ， 现 在 使 
用 cargo 命 令 创建 一 个 二 进 制 包 ， 此 处 命名 为 hashmap_jlite， 默 认 会 生成 
src/main.rs 文 件 。 然 后 在 src 文 件 夹 内 创建 一 个 lib.rs 文 件 ， 代 码 结构 如 代 
fy yey 12-38 FT A -o 


代码 清单 12-38: hashmap_lite 包 代码 结构 示意 


—— Cargo.toml 
I Sree 
| — LID. ES 


| 上 rs 


然后 ， 将 hashmap! 的 安定 义 代 码 复 制 到 Srclib.rs 文 件 中 ， 如 代码 清 
单 12-39 所 示 O 

代码 清单 12-39: srclib.rs 代 码 示 意 

1. #[macro export] 

4« maero rules! hashmap { 
3 // 同 代 码 清单 12-32 
4. } 

TES (RS 12-394 (HA J + [macro_export] 属性 ， 表 示 其 下 面 
的 宏 定义 hashmap 对 其 他 包 也 是 可 以 见 的 。 然 后 在 src/main.rs 中 使 用 ## 
[macro_use] 属 性 导入 此 宏 ， 如 代码 清单 12-40 所 示 。 

代码 清单 12-40: src/main.rs 代 人 码 示意 

La #7 RUSE 2015 


2. // #[macro use] extern crate hashmap_ lite; 
34 Ji Rust 2018 

4. use hashmap lite: :hashmap; 

Ss En Marni} 

oe let map = hashmap! { 

ts “a Ee ly 

Bis "oS = By 

Dh. }; 

LU assert eg! {map["a"], 1)% 

Lle 4 


代码 清单 12-40 中 ， 如 果 是 Rust 2015， 则 使 用 #[macro_use] 属 性 用 
在 extern crate 之前， 表示 将 hashmap_lite 中 定义 的 宏 hashmap! 导出 ， 然 
后 main 函 数 中 才 可 以 自由 使 用 hashmap! 宏 。 需 要 注意 的 是 ， 在 Rust 
2015 中 只 有 在 包 的 根 文 件 下 才 可 以 为 extern —_crate{## H #[macro_use])& 


性 。 如 果 是 Rust 2018， 则 只 需要 使 用 use 将 hashmap_jlite: : hashmap 导 
入 即 可 。 并 且 在 Rust 2018 中 ， 外 部 crate 中 定义 的 宏 是 可 以 在 根 文 件 之 
外 的 地 方 导 入 的 。 也 瓯 是 说 ， 哪 里 需要 驳 在 哪里 导入 。 

H [macro_use] 属 性 也 可 以 用 于 导出 同一 个 包 内 mod 定 义 的 模块 上 。 
如 代码 清单 12-41 所 示 。 

代码 清单 12-41: 使 用 #[macro_ues] 叶 出 mod 模 块 中 的 宏 
# [macro use] 
mod macros { 
macro rules! X i OU => 4 Yle H } 


macro rules! Y { () => {} } 


1 
2 
5 
4 
is } 
6 fn main() { 
7 ALU) 3 
8. } 

代码 清单 12-41 中 X! 可 以 被 正常 调用 。 

当 宏 做 导出 到 包 外 被 使 用 的 时 候 ， 可 能 会 碰 到 麻烦 。 有 大 时 候 导 出 的 
宏 定 义 内 部 会 依赖 包 内 的 一 些 函 数 ， 如 代码 清单 12-42 所 示 。 

代码 清单 12-42: mycrate 内 定义 的 宏 依赖 于 函数 incr 

l- SUE EH 2nerix: WZ =F tse 7 


Bo etd 

Sx J 

4. #[macro export] 

5. Hero FULES! ane | 

6. (Sx:expr) => ( s:mycrate::iner(Sx) ) 
Te d 


代码 清单 12-42 展 示 了 mycrate 包 内 宏 定 义 依赖 于 本 地 的 函数 incr， 所 
以 在 inc! 宏 定 义 内 部 使 用 了 绝对 路 径 *: : mycrate: : incr ($x) ”来 调 
用 该 水 数 。 但 是 实际 情况 中 ， 使 用 mycrate 包 的 时 候 有 可 能 将 其 改名 ， 
如 代码 清单 12-43 所 示 。 

代码 清单 12-43: extern crate mycrate 改 名 为 mc 


1. #[macro use] 
2. extern crate mycrate as mc; 
34 fn maini ji «= } 
MERRIA 12-43 Aras I UAT, inc! 安 中 依赖 的 图 数 调用 
驶 会 失效 。Rnust 为 此 提供 了 一 种 解决 方案 : 在 宏 定 义 内 使 用 $crate 变 
量 。 如 代码 清单 12-44 所 示 。 
代码 清单 12-44: 使 用 $crate 变 量 


1. #[macro export] 


i, macro cules) inc | 
Sa (Sesexpr) => 4 Seratesiiner(sSx) ) 
4 } 


hs 12-4448 H &cratese E, LAT DAE IA RE RS HH AE Te, 
目 动 根据 上 下 文 来 选择 图 数 调用 路 径 中 的 包 名 ， 比 如 在 代码 请 单 12-43 
所 示 的 情况 下 ， 会 使 用 “: : MC: : incr ( $x) 

男 外 需要 注意 的 是 ， 如 末 一 个 包 中 导入 多 个 声明 宏 包 含 了 昔 复 的 命 
名 ， 则 最 后 导入 的 声明 宏 会 履 关 先导 入 的 声明 宏 定 义 。 

使 用 macro 关 键 字 

目前 只 有 在 Nightly 版 本 的 Rust Z. hs Ae 
[feature (decl_macro) ] 属 性 才能 使 用 macro 关 键 字 。 如 代码 清单 12-45 所 
ZN o 

代码 清单 12-45: 使 用 macro 天 键 字 


ls #![feature(decl macro) ] 

2. macro unless(Sarg:expr, Sbranch:expr) { 
ce ( af !Sarg { Sbranch |); 

4. } 

Ss Th Ciipias 132, BE L327 í 

Ga unless!( a >b, { 

fa pete iniy = fh" ar Bli 

8. } ) 7 

9. } 

10, in maint) { 


id. let (a, b) = (1, 2); 
I2; emp (a, DBD}? 
13. } 
代码 清单 12-45 中 使 用 macro 天 键 宁 重 新 定义 unless! KARB. FE 
起 macro_rules! 定义 的 宏 可 读 性 更 届 。 然 而 macro 关 键 字 属于 官方 的 宏 
2.0 计 划 ， 在 不 久 的 将 来 会 稳定 发 布 ， 到 时 候 束 不 需要 使 用 feature 属 性 
Ja 


12.2.5 WEE 


(EH E HHR AY RMR PRIA Ee HEK, (EE tHe BR FRE 
目 动 生成 的 场景 。 对 于 需要 语法 扩展 的 场景 用 声明 宏 无 法 满足 ， 比 如 为 
现 有 结构 体 目 动 生成 特定 的 实现 代码 ， 或 者 进行 代码 检查 等 。 在 过 程 宏 
出 现 之 前 ， 开 发 者 可 以 通过 Rust 编 译 右 的 插件 机 制 来 满足 语法 扩展 的 诸 
多 需求 。 但 可 惜 的 是 ， 这 些 插件 机 制 并 未 稳定 ， 暂 时 只 能 在 Nightly 版 本 
的 Rust 中 使 用 ##! [feature (plugin_registrar〉] 这 样 的 feature 才 能 实现 。 

官方 核心 团队 一 直 致 力 于 解雇 稳定 化 发 布 插件 机 制 的 工作 ， 因 为 这 
么 强大 的 功能 应 该 稳定 地 提供 给 开 及 者 。 所 以 ， 经 过 核心 团队 和 社区 的 
KREZ, ATHE- HIR, MÆTA (Procedural Macros) 。 
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图 12-10: 过 程 宏 工作 机 制 示 总 

Rust 编 译 器 插件 机 制 由 内 置 的 librustc_plugin 包 提供 ， 它 通过 直接 操 
作 AST 来 达成 目的 。 所 以 ， 它 依赖 于 内 置 的 libsyntax 包 ， 该 包 中 定义 了 
词法 分 析 、 语 法 分 析 、 操 作 语 法 树 相 关 的 各 种 操作 。 但 是 要 稳定 发 布 给 
开发 者 ， 束 不 能 依赖 于 AST 结 构 。 因 为 Rust 语 言 正 处 于 上 升 发 展期 ， 
Rust 内 部 还 有 很 多 工作 要 做 ， 如 果 与 AST 结 构 粳 合 起 来 ， 将 来 AST 结 构 
有 所 变化 ， 束 会 影 啊 到 广大 开发 者 编写 的 程序 ， 这 是 任何 一 门 编程 语言 
都 在 避免 的 问题 。 

所 以 ，Rnust 官 方 团 队 在 libsyntax 的 基础 之 上， 又 抽象 出 一 层 通用 的 
ZO, MBO MMWR ， 它 被 定义 于 内 置 的 libproc_macro 包 中 。 
过 程 宏 建立 在 词 条 流 (TokenStream) 的 基础 上 ， 开 发 者 可 以 借助 于 过 
程 宏 输 入 词 条 流 ， 对 其 进行 修改 或 丛 换 ， 最 后 将 修改 后 的 词 条 流 输 出 ， 
交 给 语法 解析 器 (libsyntax 中 包含 的 parser〉 处 理 。 

基于 词 条 流 的 好 处 在 于 未 来 不 管 语 法 如 何 杰 化 ， 都 不 会 影响 到 过 程 
宏 的 使 用 ， 因 为 词法 分 析 不 需要 关心 语法 信息 。 使 用 过 程 宏 的 时 候 ， 可 
以 直接 把 传 入 的 词法 流转 为 字符 串 处 理 ， 也 可 以 配合 另外 两 个 第 三 方 库 
来 使 用 : syn 和 quote 。 其 中 syn 库 可 以 将 词 条 流 再 次 解析 为 AST 结 


构 ， 然 后 开 有 者 在 此 结构 之 上 对 其 进行 各 种 修改 或 丛 换 ， 节 后 通过 
quote 库 ， 将 修改 后 的 AST 结 构 重 新 转换 为 词 条 流 输 出 ， 这 样 束 比 直 接 处 
理 字符 串 要 方便 、 精 准 ， 如 图 12-10 右 侧 虚 线 框 选中 的 部 分 所 示 。 

所 以 ， 在 和 学习 Rust 过 程 宏 系 统 的 时 候 ， 需 要 了 解 一 个 “ 变 ” 与 一 个 “不 
ae 

-© : Rust 在 上 升 友 展期 ， 还 在 随时 添加 各 种 新 的 功能 以 及 优化 性 
能 ， 有 可 能 会 影响 到 AST 结 构 。 所 以 会 把 过 程 安 、 编 译 天 择 件 、syn、 
quote 库 都 独立 出 来 ， 以 便 更 好 地 将 过 程 宏 机 制 同 开发 者 稳定 发 布 。 

AÈ: 过 程 宏基 于 词 条 法 ， 不 会 随 语法 的 不 断 变 化 而 受 影响。 

但 要 明月, “ 变 ” 与 “不 变 ” 只 是 指 语言 结构 层面 。 比 如 libproc_macro 
库 目 喘 也 在 进化 ， 在 写本 书 的 时 候 ， 叉 出 现 了 proc_macro2 库 ， 它 是 对 
libproc_macro 库 的 进一步 抽象 和 包 竣 ， 更 多 于 使 用 。 但 基于 词 条 流 来 处 
理 过 程 宏 的 整体 思路 依然 不 变 。 

目前 ， 使 用 过 程 宏 可 以 实现 三 种 类 型 的 宏 : 

` AE QURAEIBME ， 可 以 目 定 义 类 似 于 #[derive (Debug) ] 这 样 的 
derive 属 性 ， 可 以 目 动 为 结构 体 或 枚 举 类 型 进行 语法 扩展 。 在 官方 RFC 
或 一 些 社 区 资料 中 ， 过 程 宏 也 被 称 为 宏 1.1 (Macro1.1) 。 

` 目 定义 属性 ， 可 以 目 定义 类 似 于 #[cfg“) ] 这 种 属性 。 

- Bang? ， 和 macro_rules! 定义 的 宏 类 似 ， 以 Bang 符 写 〈( 束 是 叹 
号 “! ”) 结尾 的 宏 。 可 以 像 水 数 一 样 被 调用 。 

接 下 来 ， 使 用 cargo 命 令 来 创建 一 个 lib 包 ， 名 字 为 
simple_proc_macro， 在 此 包 中 依次 实现 这 三 种 过 程 宏 。 包 目录 结构 如 代 
码 清单 12-46 所 示 。 

代码 清单 12-46: simple_proc_macro H x24 Wane 


—— Cargo- tomi 


—— Src 


| i lab, rs 
L__ tests 
一 test.rs 


在 Cargo.toml 中 将 该 包 设 置 为 proc_macro 类 型 ， 如 代码 清单 12-47 所 


不 。 
代码 清单 12-47: Cargo.toml 中 设置 lib 类 型 为 proc_macro 
[lib] 
proc Macro = Cruse 
编写 过 程 安 必 须要 求 放 到 proc_macro 类 型 的 lib 包 中 。 
H xe CYR AE Jes VE 
可 以 使 用 TDD H 的 方式 来 开发 自 定义 派生 属性 ， 因 为 在 开发 之 
前 ， 必 须要 设计 好 目 动 派生 的 代码 是 什么 。 打 开 simple_proc_macro 包 中 
的 tests/testrs 文 件 ， 在 其 中 先 编 与 预期 的 测试 代码 ， 如 代码 清单 12-48 所 
不 。 
代码 清单 12-48: tests/test.rs 文 件 中 写 入 测试 代码 
#[macro use] 
extern crate sample proc macro; 
# [derive (A) ] 
struct A; 
#[test] 
fn test derive adj | 


assert eq! ("hello from impl A".to string({), A.a()); 
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} 
测试 代码 表示 ， 打 算 实 现 一 个 目 定 义 派 生 属 性 直 [derive (A) ] , 
然后 为 单元 结构 体 A 上 自动 实现 一 个 实例 方法 a。 在 调用 方法 a 的 时 候 ， 输 
出 指定 的 字符 串 ， 如 代码 第 7 行 所 示 。 注 意 ， 使 用 目 定 义 的 派生 属性 过 
Ee, EA H[macro use] 将 其 导出 。 

打开 src/lib.rs 文 件 ， 开 始 实 现 目 定义 派生 属性 ， 如 代码 清单 12-49 所 
不 。 
代码 清单 12-49: 在 srdlib.rs 中 实现 #[deriiie (A) PIREZ 


extern crate proc macro; 

use gelf: proc macro: :TokenSstream; 

# [proc macro derive (A) ] 

pub fn derive(input: TokenStream) -> TokenStream { 
ISE ADNPUE = InpUE. EO Strang () ¢ 


assert! (1input-gcontains ("struct Ar")? 


Ooo] © OF = U N P 


re" 
m5l A 1 
En ateseli) -=> String 
Ls format! ("hello from impl A") 
Lis } 
L2. } 
I3. "#.parse().unwrap () 


14. } 

注意 当前 代码 均 基 于 Rust 2018. 

代码 清单 12-49 中 第 1 行 和 第 2 行 分 别 引 入 了 Rust 内 置 的 proc_macro 包 
及 其 中 定义 的 TokenStrem 结 构 体 类 型 。 值 得 注意 的 是 ，proc_macro 包 属 
于 Rust 目 市 包 ， 不 需要 在 Cargo.toml 中 配置 依 顿 。 引 入 路 径 前 的 self 亲 绥 
也 不 可 和 省略。 

代码 第 3 77, +[proc_macro_derive (A) ] 属 性 表示 其 下 方 的 函数 
专门 处 理 目 定 义 小 生 属 性 ， 其 中 的 “A? 与 #[derive (A) ] 中 的 “A” 相 对 
Mo 
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TokenStrem， 输 出 的 参数 类 型 也 为 TokenStrem。 

代码 第 5 行将 输入 的 参数 input 转换 为 字符 串 奖 型 来 处 理 。 访 示例 
用 于 演示 实现 目 定 义 派 生 属性 最 简单 的 情况 ， 即 从 字符 串 开始 处 理 ， 并 
不 涉及 AST 结 构 。 

代 但 第 6 行 展 示 了 input 实 际 上 融 是 测试 代 公 中井 [derive (A) ] 下 方 
的 结构 体 A 的 定义 。 可 以 想象 ， 当 编译 占 在 编译 的 时 候 人 页 到 ## 
[derive (A) ] 属 性 ， 束 会 目 动 将 其 下 方 的 代码 解 术 为 词 条 流传 入 事先 定 
义 好 的 过 程 宏 函 数 derive 中 进行 处 理 。 

代码 第 7 一 13 行 定 义 了 一 个 字符 串 ， 并 调用 它 的 parse 方法 ， 访 方 
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unwrap 方 法 才能 返回 。 该 字 从 串 中 包含 了 一 个 便 编 码 的 方法 a 的 实现 ， 
该 字 付 串 最 终 转 为 TokenStream 类 型 返回 ， 会 密 Rust 编 译 絮 再 座 处 理 ， 
从 而 生成 指定 的 代 公 。 

在 包 的 根 目 录 下 运行 cargo test， 会 发 现 测 试 将 正常 通过 。 

目 定义 属性 

派生 属性 的 目的 比较 单一 ， 就 是 为 了 给 结构 体 或 枚 淮 体 目 动 派生 各 
种 实现 ， 而 属性 的 用 途 束 相对 比较 多 。 可 以 说 目 定义 派生 属性 是 目 定 义 
属性 的 特例 。Rust 目 喘 有 很 多 内 置 的 属性 ， 比 如 条 件 编译 属性 # 
[cfg ©) 1 和 测试 属性 # [test] ， 早 期 碑 本 的 Rust 可 以 通过 编 详 项 插件 的 
方式 来 实现 属性 ， 但 插件 方式 并 未 稳定 ， 不 推荐 使 用 。 过 程 宏 实 现 目 定 
义 属性 的 功能 还 未 稳定 。 在 该 版 本 稳定 之 前， 必须 在 Nightly 版 本 下 使 用 
+! [feature (custom_attribute) ] 特性 。 但 在 编写 本 书 时 ， 最 新 的 
NightlyRust 1.31 中 ， 已 经 不 需要 此 特性 了 。 更 改 详情 请 参考 随 书 源 码 中 
的 对 应 示例 。 

依旧 使 用 TDD 的 方式 来 实现 目 定 义 属 性 功能 。 继 续 打 开 tests/test.rs 
文件 ， 编 写 独 的 测试 代码 ， 如 代码 清单 12-50 所 示 。 

代码 清单 12-50: 继续 在 tests/test.rs 中 编写 日 定义 属性 的 测试 代码 


Ll. #! (feature (custom. attribute) | 

44 use sample proc macros ratter with args; 
3. #[attr with args("Hello, Rust!")] 

4. fn foo() 4} 

5a Fl test] 

6. in test tool} i 

vs assert egi {Too (F; “Helle, Rust"); 
Be a 


代 人 码 清 单 12-50 中 使 用 # ! [feature (custom attribute) 1E. ris 
加 的 测试 代码 表示 要 实现 一 个 日 定义 属性 #[attr_with_args (" Hello, 
Rust! ") ]， 作 用 于 孙 数 foo 之 上 ， 并 目 动 修改 foo 孙 数 的 定义 和 实现 ， 
按 属 性 中 指定 的 文本 来 得 出 结果 ， 如 代码 清单 12-50 中 第 7 行 所 示 。 

继续 打开 srclib.rs 文 件 ， 纺 写实 现代 码 ， 如 代码 清单 12-51 所 示 。 


代码 清单 12-51: 在 src/lib.rs 中 继续 编写 目 定义 属性 的 实现 代码 
#! [feature (custom attribute) ] 
# [proc macro attribute] 
pub fn attr with args(args: TokenStream, input: TokenStream) 
-> TokenStream { 
let args = args.to string(); 
let input = input.ko string |) 
poroa tii ti Coe) = A BaL eter i4 i) J"e Araz) 


.parse() .unwrap () 
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} 
代码 清单 12-51 中 第 1 行使 用 了 #! [feature (custom attribute 〉] 特 
性 。 

代码 第 2 行使 用 #[proc_macro_attribute] 属 性 表示 其 下 方 的 函数 处 理 
目 定义 属性 。 

代码 第 3 行 开 始 定义 了 attr_with_args 函 数 ， 其 函数 签名 包括 两 个 输 
入 参数 args 和 input， 均 为 TokenStream 类 型 ， 返 回 值 也 是 TokenStream 类 
型 。 输 入 参数 args 代 表 测 试用 例 目 定义 属性 #[attr_with_args C" 
Hello, Rust! ") ] 括 邱 中 的 指定 文本 ， 而 参数 input 则 代表 测试 用 例 中 
该 属性 下 方 作 用 的 图 数 定义 foo。 

代码 第 5 行 和 第 6 行 分 列 将 args 和 input 转 为 学 从 串 。 

代码 第 7 行 通过 format! 宏 将 args 动 态 地 替换 到 foo 重 新 定义 的 字符 串 
中 ， 随 后 通过 调用 parse 方 法 解析 为 Result<TokenStream，Err 之 类 型 ， 
经 过 unwrap 之 后 返回 。 

执行 cargo test; WHAE EL. 

编 与 Bang 安 

在 声明 宏章 节 中 ， 通 过 macro_rules 实现 过 hashmap! 宏 ， 可 以 作为 
为 数 调 用 ， 使 用 起 来 十 分 方便 。 现 在 使 用 过 程 宏 重 新 实现 hashmap! 
宏 ， 同 样 ， 先 与 测试 用 例 ， 如 代码 清单 12-52 所 示 。 
代码 清单 12-52: 继续 在 tests/test.rs 中 实现 hashmap! 测试 用 例 


#i[feature(proc macro non items) | 

use Simple proc macro: :hashmap; 

+ [test] 

fn test hashmap() { 
IGE Am = hashiiap!{ TaT: 1, "BB"? ZZ} 
assert eq (hm a J 1) 7 
let hm = hashmap!{ "a" => 1,"b" => 2,"c" => 3}; 
assert eq! (ml Qo J 4); 
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} 

Sis 12-5249 5, AS #! [feature (proc_macro_non_items) ] 属 
性 ， 征 因为 当前 要 用 到 。 实 现 Bang 宏 ， 不 需要 通过 #[macro_use] 导 出 ， 
而 是 通过 use 关 键 字 直接 导入 。 

可 以 看 出 ， 即 将 实现 的 hashmap! 宏文 持 两 种 宏 语法 格式 ， 分 别 如 
代码 第 5 行 和 第 7 行 上 所 示 。 

打开 srclib.rs， 开 始 与 实现 代码 ， 如 代码 请 单 12-53 所 示 。 

代码 清单 12-53: 继续 在 srcwlib.rs 中 编写 实现 代码 


L. ! [feature (prod macro Non. athens) | 

2. #([proc macro] 

3. pub fn hashmap(input: TokenStream) -> TokenStream { 

4. lët 1fpur = INDIE. tO string |)? 

Dis let Input = inpiit.tram. righne matches (',"); 

6 . let inputs Vee<string> = 1nput.splind",").map(([n| 4 

Ty lee mat data = IT m:0onrains ("7s") 4 Nesplin(™:") } 
K. else { n.spLlit(" => ") }} 

9 . let (key, value) = 

LY A (data.next().unwrap(), data.next().unwrap()); 

Ll « format! ("hm.insert({}, {})", key, value) 

LZ hi Let iy 

i A let count: usize = input.len(); 

14. let tokens = format! (" 

LB. +4 

Lös let mut hm = 

dost A ii SEd collections t i HasEMapi WIth capacity (t); 
Ie 4 { } 

‘ik: hm 

au ， if, Count, 

ae Input, tter().map(|n| Format! ("{}s", nj) «collect: :<String> () 
EZ F 

EF tokens.parse() .unwrap () 

24. } 


Sis 12-5347, 3] A J #! [feature (proc_macro_non_items) ] 
特性 ， 这 就 需要 使 用 Nightly Rust， 只 有 该 特性 彻底 稳定 才 可 去 掉 。 属 性 
#[proc_macro] 表 示 其 下 方 的 函数 hashmap 是 要 实现 一 个 Bang 安 ， 该 冰 数 
表面 输入 和 得 出 参数 均 为 TokenStream 关 型 。 

整个 hashmap 函数 的 实现 思路 比较 人 简 持 ， 束 是 把 input 转 为 字符 串 ， 
IAFF EB ee AAA, Fa format! 宏 将 字符 串 拼 接 为 所 需 的 格 
式 ， 最 后 由 parse 方 法 解析 返回 。 具 体 请 查看 随 书 源码 中 详细 的 注释 。 

这 里 值得 注意 的 是 ， 过 程 安 实 现 Bang 安 的 思路 与 nacro_rules! AKI 
思路 相似 ， 都 是 拼接 生成 代码 ， 而 代 但 清单 12-53 中 ， 征 完全 对 字符 串 
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其 实 proc_macro 包 中 还 提供 了 TokenNode、TokenTree 等 结构 体 ， 以 
及 可 以 将 这 些 结构 转换 为 TokenStream 的 quote! 宏 ， 只 不 过 目前 该 功 
能 疝 未 完善 ， 要 完成 当前 示例 ， 使 用 起 来 还 不 如 解析 字符 串 来 得 方便 。 

使 用 第 三 方 包 syn 和 quote 

虽然 官方 的 proc_macro 包 功能 尚未 完善 ， 但 是 Rust 社 区 提供 了 方便 
的 包 可 以 使 用 。 通 过 syn 和 quote 这 两 个 包 和 proc_macro2 的 相互 配合 ， 
可 以 方便 地 处 理 大 部 分 需要 用 a 到 过 程 宏 的 场景 ， 比 如 目 定 义 派生 属性 。 
序列 化 框架 包 serde 就 大 量 使 用 了 syn 和 quote， 实 际 上 ， 这 两 个 包 就 是 
serde 作 者 在 编写 serde 过 程 中 实现 的 。 

其 中 ，syn 完 整 实现 了 Rust 源 人 码 的 语法 树 结 构 。 而 quote 可 以 将 syn 的 
语法 树 结 构 转 为 proc_macro: : TokenStrem 类 型 。 接 下 来 使 用 
proc_macro、syn 和 quote 共 同 实现 一 个 目 定 义 派生 属性 功能 derive-new 
[5] 。 

使 用 cargo new 命令 创建 新 的 包 derive-new， 并 添加 tests/test.rs 文 件 ， 
目录 结构 如 代码 清单 12-54 所 示 。 

代码 清单 12-54:，deritie-new 目 录 结 构 示 意 

—— Cargo.toml 


-一 SLE 


| L lib.rs 
== tepis 
L test.rs 


YA a E Cargo.toml F 5 A ZKI E, WRA 12-55 AN o 
代码 清单 12-55: Cargo.toml 配 置 文件 

[lib] 

PpLOoCc“Macro = LFue 


[dependencies] 


quote = "0.6" 
syn = "0.15" 


proc=macro2Z="0.4" 
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项 配置 了 quote 0.6 和 syn 0.15。 需 要 注意 的 是 ，syn 和 quote 的 这 两 个 版 本 
从 0.12 起 进行 了 重 构 ，API 接 口 有 重大 变动 。 
继续 使 用 TDD 的 方式 来 编 与 代码 ，derive-new 的 功能 驶 是 为 结构 体 
目 动 派生 new 方 法 。 打 开 tests/testrs 文 件 ， 编 写 测 试用 例 ， 如 代码 清单 
12-56 所 示 。 
代码 清单 12-56: tests/test.rs 中 编写 测试 用 例 
L. use derive new: New? 
2. // 无 字段 结构 体 
3 # [derive (New, PartialEg, Debug) |] 
Te HUD Struct. Foo 4} 
5. // 包含 字段 的 结构 体 
6 # [derive (New, PartialEq, Debug) ] 
7 bas Struct, Bar + 
8 BOB Bi 132; 
Dis pub vs BELLNM, 
We J 
11. // 单元 结构 体 
12. #[derive (New, PartialEg, Debug) ] 
LS. pub struct. Baz; 
14. // 元 组 结构 体 
15. #[derive (New, PartialEg, Debug) ] 
16. Pub Struct Tuple(pup 132, pub 132); 


代码 清单 12-56 中 定义 了 四 个 结构 体 ， 均 使 用 了 ##[derive (New, 
PartialEq, Debug) ] 属性 ， 其 中 New 属 性 就 是 即将 要 实现 的 目 定 义 派 
生 属 性 ， 用 于 给 这 四 个 结构 体 目 动 实现 new 方 法 ， 此 处 日 动 实现 
PartialEq 利 Debug 用 于 比较 和 打印 测试 用 例 中 的 结构 体 实例 。 这 四 个 结 
构 体 窗 庄 了 Rust 中 结构 体 的 全 部 种 类 : 有 具名 结构 体 、 单 元 结构 体 和 元 组 
结构 体 。 

结构 体 定 义 完 之 后 ， 还 需要 编写 这 四 种 结构 体 实例 分 别 调用 new 方 
法 的 汕 斌 用例， 如 代码 清单 12-57 所 示 。 

代码 清单 12-57: tests/test.rs 中 编写 调用 new 方 法 的 测试 用 例 


1. #([test] 

4a tn best empty structé() 1 

3% let x = Foo: :new(); 

4 . assert. EG: (ey Tose Ar)? 

De = 

6. #[test] 

Ts Th test Simple struct) 4 

8. let x = Bar:snew(42, "TELLO". tO owned(J)i 
9. assent ool (ts, Bar { xt 42, Wi hello"., 6 owned () |); 
Loe | 

11. #[test] 

Lae oe Lee ULIG Sleek A 

Laa let x = Baz::new(); 

14 assert egi (x; Baz)y 


LB 1} 
16... #ltest] 
li, fn test simple tuple struec() { 


Le let x = Tuple::new(5, 6); 
19. assert eg: (x, TUple(5, 6)); 
Ze J 


通过 编写 测试 用 例 ， 对 要 编写 的 实现 代码 做 了 大 致 设计 ， 对 于 三 类 
结构 体 都 需要 文 持 目 动 实 现 new 方 法 。 现 在 打开 Srclib.rs 来 编号 实现 代 
但， 如 代码 清单 12-58 所 示 。 

代码 清单 12-58: srclib.rs 中 开始 编写 实现 代码 


extern crate proc macro; 
use i 
syn::{Token, DeriveInput, parse macro input}, 
guteti, 
proc macro2, 
self: :proc macro: :Tokenstream, 
}; 


#[proc macro derive (New) ] 


O co T 6) I & C8 Bo FEF 


pub fn derive(input: TokenStream) -> TokenStream { 


eh) let ast = parse macro input! (Input as DeriveInput) ; 

Lis let result = maton ast.ddata i 

Le syn. :Data: :Struct (ref s) => new for struct(kast, &s.fields), 
Le. _ => panic! ("doesn't work with unions yet"), 

14. Es 

LB result.into () 

Lee: g 


代码 清单 12-58 中 第 1 一 7 行 引入 必须 的 包 和 TokenStream 类 型 。 
代码 第 8 行使 用 #[proc_macro_derive (New) ] 属 性 ， 代 表 其 下 方 
的 函数 用 于 处 理 #[derive (New) ] 目 劲 派生 属性 。 
REE 9 行 开始 定义 derive 函数 ， 使 用 pub 公开 其 可 见 性 ， 输 入 参 
数 和 人 返回 类 型 均 为 TokenStream 类 型 。 该 函数 主要 做 了 三 件 事 : 
通过 parse_macro_input! 宏 将 input 解 析 为 syn: : DeriveInput 类 型 
的 抽象 语法 树 结 构 。 如 代码 第 10 行 所 示 。 
通过 ast.data 判 断 数 据 类 型 是 否 为 结构 体 。syn: : Data 是 syn 包 中 
定义 的 枚 举 体 ， 一 共 包 侣 三 个 值 : Struct (DataStruct) 、 
Enum (DataEnum) 和 Union (DataUnion) ， 分 别 代 表 结 构 体 、 枚 举 体 
和 联合 体 。 但 是 本 示例 中 只 处 理 结构 体 ， 对 于 结构 体 类 型 ， 通 过 
new_for_structPk CHET ASH, MARGE 11~14747 Pro. 
Ath SE JS AS te 24 24 SRresult)v 1%) J proc_macro2: : TokenStream 类 
型 ， 然 后 通过 into 方 法 将 其 转换 为 TokenStream 类 型 并 返回 ， 如 代码 第 16 
行 所 示 。 其 中 ，proc_macro2 古 对 内 置 的 proc_macro 人 简单 包装 。 它 用 于 桥 
接 Rust 1.15 稳 定 的 旧 接 口 和 Rust 1.30 中 引入 新 接口 。 在 不 久 的 将 来 ， 也 


许 会 合并 到 Rust 中 。 
暂且 将 如 何 实现 new_for_struct 函 数 放 一 边 ， 现 在 来 看 syn: 
DeriveInput 这 个 次 型 ， 访 类 型 是 专门 为 proc_macro_derive 宏 而 设计 的 ， 
源 查 如 代码 清单 12-59 所 示 。 
代码 清单 12-59: syn: : DeriiieInput 结 构 体 源码 示意 
1. // syn::DeriveInput 
2 pub struct DerivelInput { 
3 pub attrs: Vec<Attribute>, 
4. pub Vist Visibility, 
Sk pub ident: Ident, 
6 pub generics: Generics, 
- 
8 


pub data: Data, 
j 


代码 清单 12-59 中 展示 的 DeriveInput 结 构 体 包含 了 五 个 字段 ， 它 们 代 
表 的 信息 如 下 : 

-attrs ， 实 际 为 Vec< syn: : Attribute>2e44, syn: : Atrribute 代 
表 必 性， 比如 #[repr (C) ]， 使 用 Vec<T> 人 代表 可 以 定义 多 个 属性 。 用 
于 存储 作用 于 结构 体 或 枚 举 体 的 属性 。 

“Vis ， 为 syn: : Visibility 类 型 ， 代 表 结 构 体 或 枚 淮 体 的 可 见 性 。 

-ident ， 为 syn: : Ident 类 型 ， 将 会 存储 结构 体 或 枚 举 体 的 名 称 。 

‘generics , syn: : Generics, H TEAR EIA E o 

data , syn: : Data, BHAA, MASAAKI = RE 

AY 

FAS, Deriveinput ALKI —-S  trait, WS ys 4 12- 
60 所 示 。 

代码 清单 12-60: syn: : DeriiieInput 结 构 体 实现 了 Parse 示 意 


impl Parse for DerivelInput{...} 


1 

4x Pub trait Parse: Sized i 

3 fn parse(input: ParseStream) -> Result<Self>; 
4 


在 syn 0.15 之 前 ，Parse 由 Synom 代 蔡 。 从 syn 0.153744, Synomi 


Parse 中 定义 了 parse 方 法 ， 其 输入 参数 类 型 为 syn: : parse: : 
ParseStream， 用 于 syn 内 部 解析 token 的 缓冲 流 ， 由 TokenStream 转 换 而 
成 。 

可 以 使 用 parse_macro_input! 宏 将 任意 输入 参数 转换 为 实现 了 Parse 
的 类 型 。 在 本 例 中 是 DeriveInput AE. JER, TAZ EAD AN ze lel xe AK su 
的 宏 语 法 : parse_macro_input! 〈 输 入 参数 as 目标 类 型 ) ， 其 中 的 as 
后 面 必 须 指定 明确 的 类 型 。 

除了 使 用 parse_macro input! 宏 ， 其 实 也 可 以 直接 调用 syn: : 
parse 函数 来 解析 输入 参数 input。syn: : parse 函数 可 以 将 输入 的 词法 流 
都 解析 为 指定 的 数据 结构 ， 也 就 是 抽象 语法 树 。syn: : parserk A 4 
如 代码 清单 12-61 所 示 。 

代码 清单 12-61: syn: : parse WEAN 


pub fn parse<T: Parse>(tokens: TokenStream) -> Result<T, Error> 


该 函数 内 部 会 调用 T: : parse 方 法 。 所 以 ， 如 果 在 代 但 清单 12-58 中 
使 用 syn: : parse 解 析 input 参 数 ， 并 将 其 声明 为 gwn: : DriveInput 类 型 
时 ， 就 可 以 调用 syn: : DriveInput 中 实现 的 parse 方 法 ， 最 终生 成 
syn: : DriveInput 类 型 实例 。 

所 以 ，syn 包 主 要 是 通过 和 窗 新 了 全 部 Rust 语法 结构 的 日 定义 抽象 语 
法 树 数 据 结 构 、syn: : Parse 和 parse_macro_input! /syn: : parse 这 二 
大 要 系 ， 淅 中 开 友 者 方便 地 将 传 入 的 TokenStream 类 型 的 词 条 流转 化 为 
指定 的 syn 抽 象 语法 树 ， 如 图 12-11 所 示 。 男 外 ，syn 还 提供 了 功能 强大 的 
Token! [...] 宏 ， 用 于 实现 自 定 义 的 AST。 读 者 可 以 通过 查阅 syn 相 关 文 
档 了 解 目 定义 AST 的 用 法 。 


struct && impl Parse 


parse_macro_input! 
(input as T) 
OR 


syn::parse<T> 





12-11: syn 三 大 要 素 示 意 
在 对 syn 有 一 定 认识 之 后 ， 回 到 derive-new 的 示例 中 ， 接 下 来 要 实现 
new_for struct 函 数 。 前 面 提 到 过 ， 在 Rust 中 ， 一 共有 三 种 结构 体 ， 那 么 
该 图 数 驶 必须 同时 满足 这 三 种 结构 体 才 行 。 如 代码 清单 12-62 所 示 。 
代码 清单 12-62: 在 Srclib.rs 中 继续 实现 new _ for struct 范 数 


1. // 其 他 代码 同上 ， 此 处 省 略 

2 ih. new [or Struct (ast: asynt+Derivelnput, fields: ksyns i Pields) 
3 -> proc: macroz::Tokenstream 

4. { 

s match *fields { 

6 syn::Fields::Named(ref fields) => { 

y new impl(&ast, Some(&fields.named), true) 

8 by 

9 syn::Fields::Unit => { 

LO, new impl(é&ast, None, false) 

i Ma a he 

12 syn::Fields::Unnamed(ref fields) => { 

13a new impl(&ast, Some(&fields.unnamed), false) 
14. F 

LS } 

Lge J 


ARIDA 12-62 H}, new for struct 图 数 包 括 两 个 参数 : ast 和 
fields。 其 中 ast 是 syn: : DeriveInput 引用 类 型 ，fields 是 syn: : Fields 
引用 类 型 。 该 函数 返回 值 为 proc_macro2: : TokenStream 类 型 ， 因 为 该 
PRI AGE TE derive pe ASCP A lA], m AG BLA’ A proc_macro2 H 
TokenStream 类 型 。 

此 处 用 到 的 syn: : Fields 类 型 属于 syn: : Expr 枚 举 体 中 定义 的 一 个 
值 ， Ff Hsyn: : Fields 本 里 也 是 枚 举 体 ， 定义 了 三 个 值 : Syn: : 

Fields: : Named, syn: : Fields: : Unit 和 syn: : Fields: : 

Unnamed， 分 别 代表 命名 结构 体 、 单 元 结构 体 和 元 组 结构 体 中 的 字段 信 
因数 实现 比较 简单 ， 通 过 match 匹 配 fields 的 类 型 ， 调 用 相应 的 
new_impl 函 数 ， 需 要 将 ast、 不 同 结构 体 的 字段 信息 、 判 断 是 否 为 命名 结 

构 体 的 布尔 值 一 起 传 进去 。 
接 下 来 继续 实现 new_impl 国 数 ， 如 代码 清单 12-63 所 示 。 
代码 清单 12-63: 在 srclib.rs 中 继续 实现 new_impl 函 数 


1. fn new impl(ast: &syn::DerivelInput, 

2 fields: Option<&syn: :punctuated: : Punctuated 

3 <syn::Field, Token![,]> 

4 Shs 

Di named: bool) -> proc macro2::TokenStream 

Oo. 4 

7 let struct name = éast.ident; 

8 let (mpl generics, ty generics, where clause) = 
9 ast. generics. Split Tor mpl, 

Ly, let (mut new, doc) = ( 

Lla syns: ldentisnew("new";, proc macro? Spani reall sites ()), 
l2; format! (“Constructs a Hew “{}°.", Struct mane) 
LS pi 

14. let args = "TODO"; 

LB let inits = "TODO"; 

16. quote! { 

Ls impl #impl generics #struct name #ty generics #where clause { 
18. #[doc = #doc] 

19. pub fn #new(#(#args),*) -> Self { 

2D s #struct name #inits 

Ai., } 

DLs } 

ao } 

24. } 


Sis 412-637, ek Wnew impll F=aTtB2, HPast#llnamed3s 
型 已 经 介绍 过 。fields 的 Option<&syn: : punctuated: : Punctuated< 
syn: : Field, Token! [，]>> 闫 型 看 上 去 比较 长 ， 下 面 将 其 “ 拆 解 为 
几 个 独立 的 部 分 来 理解 它 : 

”最 外 层 的 类 型 为 Option<T>, #7 fields 类 型 整体 是 一 个 可 选 
值 ， 因 为 对 于 单元 结构 体 来 说 ，fields 的 值 为 None。 

- 第 二 层 是 syn: : punctuated: : Punctuated 二 T，P 放 类 型 ， 该 结构 
用 于 存储 由 标点 符 写 分 隔 的 语法 树 节 点 序列 。 第 用 的 有 : 

>Punctuated<Field, Token! [，]>， 用 逗号 分 隔 的 结构 体 字 段 序 


列 。 

>Punctuated<PathSegment, Token! [: : ]>, HWAS (: : ) 
分 隔 的 路 径 序列 。 

>Punctuated<TypeParamBound, Token! [+]>， 泛 型 参数 序列 。 

>Punctuated<Expr, Token! [, ]>, PAAR. 

第 三 层 是 二 syn: : Field, Token! [，]>， 分 别 是 结构 体 字 段 和 

过 号 标记 。 

所 以 ， 整 个 fields 类 型 可 以 理解 为 表示 类 似 于 “Struct{a: 1, b: 2, 
c: 3}? 或 “Struct (1，2，3)“” 中 字段 的 语法 树 结 构 。 访 函数 返回 值 依然 
是 proc_macro2: : TokenStream. 

代码 第 7 行 中 ， 因 为 ast 是 DeriveInput 结 构 ， 所 以 调用 它 的 ident 字 
段 ， 束 可 以 得 到 当前 结构 体 的 名 称 struct_name。 

代码 第 8 行 和 第 9 行 通 过 ast 的 generics 取 得 结构 体 中 泛 型 相关 的 信 
轧 ， 然 后 通过 调用 split_for_imp] 方 法 返回 元 组 结构 ， 通 过 let 和 模式 匹配 分 
HE Z4impl_ generics. ty_generics#llwhere_clause. 

代码 第 10 一 13 行 分 别 声明 了 new 标 识 符 和 文档 说 明 doc， 会 用 于 后 面 
的 生成 代码 。 这 里 值得 注意 的 是 ， 使 用 了 syn: : Ident: : new 方法 将 
字符 串 转 换 为 syn 的 语法 树 结构 以 备 使 用 ， 在 后 面 使 用 quote! 进行 代码 
生成 的 时 候 不 允许 直接 使 用 字符 串 ， 当 然 文 档 doc 除 外 。 

代码 第 14 行 和 第 15 行 声明 了 两 个 变量 args 和 inits， 分 别 用 于 表示 将 
来 new 了 水 数 中 传 入 的 参数 和 字段 信息 。 这 个 比较 复杂 ， 此 处 暂时 用 字符 
E 

RI 16~2347 F, quote! 宏 的 使 用 方法 和 定义 macro_rules! 宏 时 
天 不 多 ， 不 同 点 在 于 ，qduote! RAHA So“ HRA Bmacro_rules! 安 
中 的 “$”。 整 个 quote! 宏 相 当 于 是 生成 代码 的 “模板 ”， 等 价 于 要 生成 代 
码 清单 12-64。 

代码 清单 12-64: 和 quote! 宏 要 生成 的 代码 等 价 的 生成 代码 示意 


1 impl<T> Stuct<t> where Ti Trait 

2 #[doc="some desc"] 

uw pub [fn newlarogls Tr ro TT) => elfi 
4 SLIEUCCY argls argi; arozi argZt 

SP } 

6 } 


代码 清单 12-64 使 用 伪 代 码 展示 了 quote! 宏 要 生成 的 代码 示意。 
由 此 可 以 看 出 ， 代 码 清单 12-63 中 第 19 行 定义 new 方 法 的 时 候 ， 用 到 
J“ (Hargs) ，*” 模 式 ， 这 和 marco_rules! 宏 的 “$ C$args) , PA 
类似， 同样 表示 重复 零 次 或 多 次 ， 这 里 表示 new 参 数 可 能 是 零 个 ， 也 可 
能 是 多 个 。 

接 下 来 只 需要 搞定 args 和 inits 两 个 变量 即 可 。 因 为 字段 信息 比较 复 
洒 ， 所 以 需要 一 个 独立 的 结构 体 来 存储 字段 的 信息 ， 如 代码 清单 12-65 
所 示 。 

代码 清单 12-65: 在 srclib.rs 中 定义 FieldExt<′ a> 结 构 体 

1. // 其 他 代码 同上 
Z St ant FLSlLGcExt<"a> { 
Ba ty: &'a syn::Type, 
4 ident: syn::Ident, 
3 named: bool, 
Bu. } 

代码 清单 12-65 中 定义 了 FieldExt<′a> 结 构 体 ， 其 中 字段 ty 用 来 存 
储 结 构 体 字段 的 类 型 信息 ，ident 用 于 存储 结构 体 字 段 的 字段 名 ，named 
用 来 存储 判断 该 字段 是 否 为 命名 结构 体 的 布尔 标记 。 实 际 上 ，new 方 法 
的 参数 名 和 字段 名 也 是 一 一 对 应 的 ， 所 以 也 可 以 用 该 结构 体 来 存储 参数 
信息 。 

接 下 来 为 FieldExt 二 ”a 二 结构 体 实现 一 些 方 法 ， 如 代 人 码 清 日 12-66 
BAR o 

代码 清单 12-66: 在 src/lib.rs 中 为 FieldExt 二 ”a 结构 体 实现 一 些 
方法 


Les 
136 
14. 
Las 
lGa 
Lis 
Lös 
ie 
ZU. 
AL a 
Ae 2 
EO = 
24. 
2D a 
20% 
SF a 
AD s 
2J a 
BU i 
ci 


impl<'a> FieldExt<'a> { 


} 


pub fn new(field: &'a syn::Field, idx: usize, named: 


=> FieldExt<'a> { 
FieldExt { 
ty: field. ty, 
ident: if named { 
field.ident.clone() .unwrap () 
} else { 
syn::Ident: :new ( 
Srormat! ("fT }", idx), 


preoc Maerozt ipani Ell sare() 


by 


named: named, 


} 


bool) 


pub fn as arg(éselt) => proc macroz: :Tokenstream 4 


ler. © tate = HLL eens 
let ty = &self.ty; 
quote! (#f name: #ty) 

} 


Pub In as 1nit(éselt) -> proc MaGrD2 *Tokenstream i 


Lert. £ Hate = sect. Lact > 

let init = quote! (#f name); 

if selt.named i 
quote! (# name: #init) 

r LE i 


quote! (#init) 


实例 方法 用 于 得 到 字段 信 ， 


代码 清单 12-66 中 为 FieldExt<”′a> 结 构 体 实现 了 new 方 法 用 于 创建 
该 结构 体 实例 ，as_arg 实 例 方法 用 于 得 到 参数 信息 的 ”proc_macro2: 


TokenStream 结构 ，as_init 


自 的 


proc_macro2: : TokenStream 结 构 。 

代码 第 2 一 15 行 new 方 读 中 ， 第 一 个 参数 field 为 gwn: : Field 的 引用 
类 型 ， 该 类 型 为 结构 体 ， 记 录 了 结构 体 字 段 的 信息 ， 包 括 类 型 (ty + 
Bo) 、 字 段 名 称 COption<Ident>) 和 等。 注意 和 前 面 出 现 过 的 syn: 
Fields 区 分 。 第 二 个 参数 idx 是 用 于 记录 元 组 结构 体 的 字段 位 置 。 

代码 第 17 一 21 行 中 ，as_arg 方 法 为 FieldExt<′a> 结 构 体 的 实例 方 
法 。 通 过 获取 ty 和 ident 信 息 ， 分 别 得 到 参数 的 类 型 和 名 称 ， 最 后 通过 
quote! 宏 生 成 函数 参数 形式 的 词 条 结构 。 

代码 第 22~30 行 中 ，as_init 方法 用 于 处 理 字 段 的 信息 ， 如 果 命 名 
ZERIE, ÆJ“ Hf name: #init* 这 样 的 词 条 结构 ， 盏 则 只 需要 得 
到 单独 的 “并 init” 词 条 结构 即 可 。 

注意 ，new 方 法 的 参数 名 和 返回 结构 体 实例 字段 名 是 一 样 的 ， 参 考 
代码 请 单 12-64。 

接 下 来 继续 完善 new_impl 函 数 ， 如 代码 清单 12-67 所 示 。 

代码 清单 12-67: 在 src/lib.rs 中 继续 完善 new_impl 函 数 


i ih Hew spl (ast: Syni :Derivelnput, 

2 fields: Option< 

3 &Syn::punctuated: :Punctuated<syn::Field, Token! [,]> 
4 Be, 

<i named: bool) -> prec mactoz!: TokensStream 

6 { 

7 let Struct trans = papt: 14dent; 

8 lai, UT = UO one tis 

9 let empty = Default::default(); 

LO. tet fields: Vecs > = fields -unwrap on(kempty) .iber() 
LL .enumerate () 


Le i .map(|(i, £)| FieldExt::new(f, 1, named)).collect(); 


ik let args = fields.iter().map(|f| f.as arg()); 


L, let inits = fields.iter().map(|f| f as init()); 
15. let inits = if unit { 

LG quote! () 

i ie gA } else if named { 

18. quote![ { #(#inits),* } ] 

19. } else { 

Zs quote![ ( #(#inits),* ) ] 

a $ 

22 y // 同上 

Zon } 


代码 清单 12-67 中 代码 第 8 一 21 行 为 新 增 内 容 。 

代 但 第 8 行 声 明 unit 杰 量 用 于 判断 是 否 为 单元 结构 体 。 代 人 码 第 9 行 瑞 
明 empty 变 量 ， 利 用 Default: : default 方 法 自动 推断 单元 结构 体 的 字段 
值 为 单元 值 。 

5B 10~ 1277 II (hak filed 7% AFieldExt<’ a>WayZHeee . 

代码 第 13 行 和 第 14 行 分 别 通过 as_args 和 as_init 得 到 参数 和 字段 的 词 
条 结构 。 

代码 第 15 一 21 行 中 ， 判 断 如 果 是 单元 结构 体 ， 则 和 直接 调 用 至 的 
quote! 宏 ， 没 有 任何 宏 体 。 如 果 是 命名 结构 体 ， 则 使 用 “{# CH 
inits 〉，*}” 模 式 ， 将 字段 循环 生成 形 如 “{arg1: argl, arg2: arg2}” 这 样 
的 词 条 结构 。 如 果 是 元 组 结构 体 ， 则 使 用 “(##〈(#inits〉，*) ”模式 ， 
将 字段 循环 生成 形 如 “ (arg1，arg2) ”这 样 的 词 条 结构 。 

至 此 ，derive-new 的 代码 就 全 部 完成 了 了 ， 执 行 cargo test 命令 之 后 ， 
可 以 看 到 测试 正 第 执行 通过 。 上 面 的 代码 还 有 可 以 扩展 的 地 方 ， 比 如 通 
过 属性 为 字段 添加 默认 值 ， 如 代码 清单 12-68 所 示 。 

代码 清单 12-68: 改进 #[deriiie (New) ] 属 性 ， 支 持 # 
[new (iialue=xxx) ] 为 字段 指定 默认 人 


1. #[derive (New) ] 

Ze pub struct. Fred í 

3 # [new (value = "1 + 2")] 

4. pu Xi L392: 

Des bus Yi SERLIG, 

6. #[new(value = "vec! [-42, 42]") ] 

Ts pub z: Vec<i8>, 

Ds 4 

9. #([test] 

I0; fn test struct with values() 4 

eat let % = Fredssnew ("Fread” «to owned () ys 
12 assert 6g: 

Les x, 

1 ey p Fred. 4 x: 3, y: “Free”.te owned(), zz TECI [dy 422] | 
1S, F 

Loe d 


H SK IRI E 12-68 测试 用 例 摘 述 的 功能 ， 需 要 使 用 # 
[proc_macro_derive (New, attributes (new) ) ] 宏 ， 然 后 在 对 应 的 
derive 函 数 中 处 理 attributes 的 信息 。 有 具体 如 何 实现 ， 瓯 留 给 读者 来 完 
成 。 


12.3 编译 器 插件 


Rust 中 最 强大 的 元 编程 工具 非 编 详 占 插件 瑞 属 ， 但 可 惜 的 是 ， 编 译 
俐 插件 日 前 还 不 稳定 。 在 Nightly 版 本 的 Rust 之 下 ， 配 合 #! 
[feature (plugin_registrar)] 特 性 ， 可 以 实现 编译 问 插 件 。 

编译 器 插件 由 内 置 的 librustc_plugin 包 提 供 ， 该 包 对 外 公开 了 八 种 
方法 供 开 发 者 编写 不 同 功能 的 编译 器 插件 ， 具 体 如 下 : 

register_syntax_extension， 可 以 通过 它 实 现任 意 语法 扩展 。 

- register_custom_derive , += »*tregister_syntax_extensionH') 2x, 
专门 用 于 实现 目 定 义 派生 属性 。 

- register_macro ， 同 样 古 对 register_syntax_extension 的 包 北 ， 用 于 
实现 Bang 安 。 

register_attribute， 用 于 实现 编译 颖 属性 。 

其 他 四 种 与 jint 属 性 和 llvm 相 关 。 

接 下 来 实现 一 个 徐 单 的 编 详 磊 捅 件 ， 使 用 cargo new 命令 创建 一 个 
lib 包 ， 名 称 为 plugin_demo， 再 添加 tests/test.rs 文 件 用 于 测试 ， 目 录 结 构 
如 代码 清单 12-69 所 示 。 

代码 清单 12-69: plugin_demo 目 录 结 构 


-一 Cargo.toml 


i Ets 


| L— lib.rs 
— tests 
ksa test.rs 


在 Cargo.toml 文 件 中 将 jib 设 置 为 plugin 半 型， 如 代码 清单 12-70 所 
不 。 
iS is 12-70: Cargo.toml 文 件 中 将 lb 设置 为 plugin 类 型 
[lib] 


plugin = true 


打开 tests/test.rs 文 件 ， 编 写 测 试用 例 ， 如 代码 清单 12-71 所 示 。 


代码 清单 12-71: 在 tests/test.rs 中 编写 测试 用 例 
1. #! [feature (plugin) ] 


2. #![plugin(plugin demo) | 

3. #[test] 

Se In CESE pliginty | 

Sia assert. eg! (roman to digit! (MMXVIIT), 2018); 
6. } 


RAS PL12-71 PEF  #! [feature (plugin) ] 特性 ， 如 第 1 行 所 
示 ， 所 以 需要 在 Nightly 版 本 的 Rust 下 运行 。 

代码 第 2 行使 用 #! [plugin (plugin_demo) ] 属性 将 plugin_demo 中 
定义 的 语法 扩展 导出 。 

代 介 第 4 行 定 义 了 测试 函数 ， 访 函数 中 使 用 roman to digit!  Z%, 
将 罗 瑟 数字 MMXVIII 转 换 为 阿拉 伯 数 字 2018， 并 对 转换 结果 进行 判 
WE 

FI H src/lib.rs LAF} gn 5 RARA, OSs 12-72 

代码 清单 12-72: 在 src/lib.rs 中 编写 插件 的 实现 代码 


1. #![feature(plugin registrar, rustc private) ] 


CXLErn €race Bynilax; 

extern crate ruste; 

extern crate ruste plugin; 

use self::syntax::parse::token; 


use self::syntax::tokenstream: :TokenTree; 


—] Ch GT am Go Bh? 


use self::syntax::ext::base::{ExtCtxt, MacResult, DummyResult, 
MacKager}; 

8. use self::syntax::ext::build: :AstBuilder; 

9. use self::syntaxt:ext: :quote::rt::Span; 


l0. use self:sruste plugins: Registry; 


Ile static ROMAN NUMERALS: &'static [(&'static str, usize)] = &[ 
iy Cm Lo Cer Buoy Rr SOT, ED, Wua 

L3. CO UW ER By. i, e (S hy, 

14, ae, Le, (ee, Ty, DP. Bh, (A, ai, 

l3; me, 1) 

16. J; 


代码 清单 12-72 中 第 1 行使 用 了 #! [feature (plugin registrar, 
rustc_private) ]， 包 含 特性 plugin_registrar 和 rustc_private。 目 前 日 定义 
编译 器 插件 功能 还 未 稳定 ， 所 以 必须 在 Nightly 下 使 用 这 两 个 特性 。 

代码 第 2 一 10 行 引入 相关 的 包 和 类 型 。Syntax 包 实际 上 束 是 Rust 源 人 码 
内 的 libsyntax 包 ， 而 rustc_plugin 就 是 Rust 源 码 内 的 librustc_plugin 包 。 

代码 第 11 一 16 行 定义 一 个 静态 变量 ROMAN_NUMERALS， 其 中 记 
孙 了 基本 的 罗 己 数字 到 阿拉 人 数字 的 配对 元 组 ， 用 于 后 续 计 算 。 

接 下 来 ， 实 现 具 体 的 罗马 数字 到 阿拉 人 数字 的 转换 函数 ， 如 代码 清 
单 12-73 所 示 。 

代码 清单 12-73: 继续 在 srcwlib.rs 中 这 加 expand_roman 函 数 


1. fn expand roman(cx: &mut ExtCtxt, sp: Span, args: &[TokenTree] ) 
2 -> Box<MacResult + 'static> 
oe 4 
4 let text = match args[0] { 
A Tokentnee:iToken(, , DokSsnitidsnt(s, J) => 6. Strg), 
6 o => 1 
7 Cx.span err(sp, "argument should be a single identifier") ; 
8 return DummyResult::any (sp); 
9. } 
10. $ 
Lie let mut text = &*text; 
12% let mut total = 0; 
13. while !text.1is empty() { 
14. match ROMAN NUMERALS 
15. -iter().find(|&&(rn, 7] text.starts with(rn) ) 
16. { 
ded Some (& (rn, val)) => { 
l8. total += val; 
L3, text = &text[rn.len()..]; 
20. } 
A s None => { 
De a cx.span err(sp, "invalid Roman numeral") ; 
8 a return DummyResult::any(Ssp); 
24. } 
CAST } 
ZO; } 
Ad a MacKager: :expr(cx.expr usize(sp, total) ) 
Sae J 


Raia 12-734, ze T expand_roman žit, ize P= 
个 参数 : 
“ CX ， 代 表 代 人 码 的 上 下 文 环境 ， 为 ExtCtxt 的 可 变 引 用 类 型 。 
‘Span 类 型 ， 表 示 代 人 码 的 位 置 等 信息 。 
TokenTree 切片 数组 ， 表 示 经 过 编译 妖 分 词句 得 到 的 代码 词 条 


树 o 

函数 的 返回 值 是 Box< 关 MacResult+ static> 类型， 是 一 个 trait 对 
象 。 其 中 MacResult 是 一 个 trait， 访 trait 中 定义 了 很 多 方法 用 于 组 装 AST 
结构 。 因 为 编 详 硕 插件 是 百 接 修改 AST 结 构 来 实现 语法 扩展 的 。 

代码 第 4 一 10 行 定义 了 text 绑 定 。 其 中 args[0] 是 一 个 TokenTree 数 据 
类 型 ， 通 过 match 匹 配 ， 将 token: : Ident 标 识 符 类 型 的 值 。 ”匹配 出 来 ， 
然后 生成 字符 串 ， 并 赋值 给 text。 因 为 在 测试 代码 中 传 给 
roman_to digit! 宏 的 罗马 数字 MMXVIII 会 被 识别 为 标识 符 。 但 是 ， 
如 果 匹 配 失 败 ， 则 表示 传 入 的 参数 不 是 标识 符 ， 而 是 其 他 类 型 ， 比 如 数 
字 、 字 符 串 等 。 则 通过 调用 cx.span_err 方 法 ， 为 位 置信 息 sp 设 置 错误 提 
示 ， 并 通过 DummyResult:; : any 国 数 将 错误 信息 sp 返回 去 ， 以 便 使 用 者 
EDR ER ER o 

代码 第 12 行 定义 total 绑 定 ， 并 赋值 为 0%， 用 于 计算 最 终 的 阿拉 伯 数 


RY 


ie 

EE B13 ~ 2647 KTS YD BBE text, KLAN SESSTE 
ROMAN_NUMERALS5sfas 22 BF FR AAT DVB (Aa, FPR THOR 
和 ， 人 然后 将 结束 赋予 最 终 的 total 绑 定 。 如 末 在 ROMAN_NUMERALS 评 
态 杰 量 中 没有 答 到 对 应 的 罗马 数字 ， 则 继续 通过 调用 cx.span_err 方 法 ， 
为 位 置信 息 sp 设 置 相应 的 错误 提示 ， 并 将 sp 返回 。 

代码 第 27 行 通过 MacEager: : expr 将 最 终 的 total 和 sp 返回 。 
CX.eXpr_usize 指 定 total 的 类 型 为 usize。 

MacEager 是 一 个 枚 举 体 ， 它 定义 Rust 的 语法 结构 作为 枚 举 值 ， 包 
Hee IA Zh Cexpr) 、 模 式 (pat) . am (items) ~ SKELIN 
(impl items) 、 语 句 (stmts) 和 类 型 (ty) 等 。 

接 下 来 定义 roman_to_digit 安 ， 如 代码 清单 12-74 所 示 。 

代码 清单 12-74: 继续 在 srclib.rs 中 定义 roman_ to_digit 函 数 
#[plugin registrar] 

pub fn roman to digit(reg: &mut Registry) { 


reg.register macro("roman to digit", expand roman) ; 


m UO hb F 


‘US 12-74 28 147 8 H [plugin_registrar] 属 性 ， 表 示 其 下 方 的 


函数 实现 编译 器 插件 功能 。 在 roman_to digit 函数 中 使 用 ”reg 的 
register_macro 来 定义 一 个 宏 ， 名 字 叫 作 roman_to_digit， 然 后 对 应 
expand_roman FA 2 HJ J He - 

最 后 ， 在 plugin_demo 包 根 目录 下 执行 cargo ret g, MAAIE Fe Aa 
通过 。 需 要 注意 的 是 ， 访 目 定 义 编 详 需 插 件 示例 当前 可 以 在 Rust 1.30 下 
正常 编译 执行 ， 在 未 来 很 有 可 能 编译 失败 ， 因 为 Rust 内 部 的 libsyntax 包 
是 不 断 变 化 的 。 但 是 ， 即 便 libsyntax 的 语法 会 改变 ， 基 本 的 原理 也 是 不 
变 的 ， 只 要 掌握 基本 的 原理 ， 也 可 以 在 编 详 失败 的 基础 上 很 快 将 其 修 
复 。 

通过 此 例 可 以 看 出 ， 编 号 编译 颖 插件 和 编号 过 程 宏 整 体 激 程 很 相 
似 ， 但 是 在 细节 上 有 大 距 ， 前 者 下 接 依 赖 AST 结 构 ， 而 后 者 只 是 依赖 
TokenStream 词 法 结构 。 从 语言 功能 稳定 的 角度 看 ， 过 程 安 要 优 于 编 详 
andere, TITRA 2.0 稳定 发 布 的 计划 内 容 。 男 外 ， 过 程 宏 的 文档 比较 
全 ， 而 编译 鼎 插 件 的 文档 很 少 ， 开 发 者 只 能 从 源码 中 获取 信息 。 所 以 ， 
作为 开 肥 者 ， 应 该 优先 选择 过 程 安 ， 而 非 编 详 需 插 件 ， 除 非 过 程 宏 无 法 
达成 目的 。 


12.4 小 结 


本 章 从 元 编程 概念 谈 起 ， 总 结 了 编程 语言 中 提供 的 元 编程 方式 ， 包 
括 反 射 和 语法 扩展 。Rnust 语 言 作 为 系统 级 静态 语言 ， 对 于 反射 的 文 持 相 
比 其 他 动态 语言 来 说 ， 功 能 不 够 蝇 大 ， 仅 仅 可 以 识别 静态 生命 周期 的 类 
型 信息 。 但 Rust 提 供 的 宏 功 能 是 强大 的 。 

Rust 提 供 了 两 种 宏 ， 一 种 是 声明 宏 ， 男 一 种 是 过 程 宏 。 

声 明 宏 在 Rust 中 最 党 用 ， 它 可 以 编写 Bang 宏 ， 也 束 是 可 以 像 函 数 调 
用 那样 使 用 ， 但 是 和 函数 调用 不 同 的 地 方 在 于 ，Bang 宏 返回 的 是 生成 代 
人 码 ， 而 函数 调用 返回 的 是 求 值 结 琳 ， 分 清 这 个 疾 别 很 午 要 。 妆 前 只 能 
macro rules! 来 定义 声明 宏 ， 但 在 Rust 2018 发 布 之 后 ， 宏 2.0 计 划 应 该 
可 以 实施 完成 ， 到 时 候 就 可 以 使 用 macro 关 键 字 玉 定 义 声 明 宏 。 

Rust 也 支持 编译 鼎 手 件 机 制 ， 但 是 编译 占 插 件 依赖 于 AST 结 构 。 如 
果 要 面 同 开 发 者 稳定 地 目 定 义 编译 占 插件 功能 ， 束 不 能 太 依赖 于 AST 绽 
构 ， 因 为 Rust 还 在 发 展期 ，Rust 本 喘 还 在 不 断 地 优化 ， 虽 然 在 语法 上 已 
经 稳定 ， 但 是 其 内 部 的 语法 树 结构 有 可 能 会 变化 ， 这 吏 不 利于 将 其 对 外 
稳定 公开 给 三 大 开发 者 。 所 以 ， 过 程 宏 束 出 现 了 ， 它 基于 词 条 流 
(TokenStream) , AIRE ON Ae, EARNS, ANCA 
个 携 市 语法 信息 。 

使 用 过 程 宏 可 以 日 定义 派生 属性 、 编 写 Bang 宏 ， 以 及 编写 日 定义 
属性 。 最 早 稳 定 的 过 程 宏 功能 是 目 定 义 派 生 属性 ， 也 被 称 为 宏 1.1。 编 
与 Bang 宏 在 Rust 1.30 中 已 稳定， 在 此 版 本 前 需要 使 用 # ! 
[feature (proc_macro) ] 特 性 。 寿 要 使 用 过 程 安 编 写 目 定义 属性 ， 则 需 
要 使 用 # ! [feature (custom attribute) ] 特 性 。 此 处 也 注意 参考 随 书 源码 
中 的 更 新 。 

过 程 安 配合 第 三 方 库 syn 和 quote 可 以 更 方便 地 编码 。 但 信 得 注意 的 
是 ，syn 和 quote 只 支持 Rust 的 语法 。 如 果 想 像 声 明 宏 那 样 定义 比较 自由 
的 宏 语法 ， 是 不 文 持 的 。 这 在 一 定 程度 上 保证 了 Rnust 安 不 会 被 滥用 ， 即 
便 开 发 者 使 用 过 程 宏 来 定义 Bang 宏 ， 其 宏 语 法 也 只 能 是 Rust 的 语法 ， 而 
不 是 其 他 奇怪 的 语法 。 再 加 上 宏 展 开 过 程 也 会 经 过 Rust 编 译 峰 的 安全 检 
但 ， 所 以 大 可 放心 地 使 用 Rust 的 安 。 


Bia, IRS LA aN SORA SO a i PE. A 
开发 者 优先 选择 过 程 宏 ， 但 是 了 解 一 下 如 何 编写 编 详 带 插件 也 很 用 
助 。 当 前 Rust 社 区 的 第 三 方 包 或 框架 也 有 使 用 编译 问 插 件 实 现 相应 的 语 
法 扩展 。 比 如 Web 开 发 框架 rocket， 在 Rust 0.3 中 束 用 了 编译 右手 件 的 方 
式 来 实现 目 定义 属性 ， 如 代码 清单 12-75 所 示 。 

代码 清单 12-75: rocket 示 例 
1 #! [feature(plugin, decl macro) ] 
2 #! [plugin (rocket codegen) ] 

3. extern crate rocket; 

4. #[get("/") ] 

5 fn. Bellö) -> &'StEatLe Str | 
6 "Hello, wordd!” 

| 
) 


8. fn main() { 
rocket: :ignite().mount("/", routes! [hello]).launch(); 


IDs .| 

代码 清单 12-75 展 示 了 Web 开 发 框架 rocket 的 一 个 Hello World 示 例 。 
从 代码 第 1 行 看 得 出 来 ， 用 到 了 plugin 和 decl_macro 两 个 特性 ， 人 代表 
rocket 内 部 使 用 了 编译 占 插 件 机 制 和 macro 关 键 字 。 

A e247 F, #! [plugin (rocket_codegen)] 代 表 rocket_codegen 
包 中 使 用 编译 强手 件 方式 定义 了 一 些 语法 扩展 。 

代码 第 4 行 中 ， 并 [get 0"/"”) ] 目 定义 属性 ， 为 第 5 行 的 hello 函 数目 
动 生成 了 路 由 相关 的 代码 ， 这 样 一 来 ， 当 有 “GET https: /domain/ 这 样 
的 HTTP 请 求 时 ， 底 可 以 目 动 调用 到 hello 逊 数 。 

这 就 是 Rust 天 于 元 编程 的 一 切 ， 虽 然 Rust 还 在 不 汤 完善 ， 但 它 实现 
TUF FEY “HEL” HE ANE YY 








[1 实际 的 编译 过 程 并 非 是 严格 按 这 个 先后 顺序 的 ， 有 些 过 程 实 际 上 是 同时 进行 的 。 
[2] 定义 于 Rust 源 人 码 src/libsyntax/ext/tt/macro_rules.rs 文 件 中 。 

[3] 事实 上 没有 这 样 的 术语 ， 这 里 只 是 为 了 方便 说 明 。 

[4] TDD: 测试 驱动 开发 。 

[5] 模仿 GitHub nrc/derive-new 的 实现 。 





HAZE MALE NIA 


混沌 浦 现 秩序 ， 光 明 源 目 黑 蜡 。 

现代 人 类 依 徘 钢 锰 混凝土 结构 的 现代 建筑 来 挡 风 谈 两 、 祛 署 如 震 ， 
舒服 地 至 受 生 活 ; 在 大 气 层 和 地 球 磁 场 的 保护 下 ， 削 蚤 了 一 次 又 一 次 能 
够 重创 现代 文明 的 踢 太 阳 高 能 电子 流 和 其 他 宇宙 射线 的 冲击 ; 木星 、 土 
性 等 巨 行 星 形 成 的 屏障 ， 大 大 地 降低 了 小 天 体 措 击 地 球 的 概率 。 这 和 是 一 
个 无 条 的 事实 : 不 安全 是 这 个 世界 的 本 质 ， 绝 对 的 安全 并 不 存在 。 

计算 机 世界 中 亦 是 如 此 。Rust 语 言 通过 一 系列 静态 分 析 机 制 保 隧 了 
内 存 安 全 。 然 而， 作为 系统 级 编程 语言 ，Rust 无 可 避免 地 需要 直接 与 操 
作 系 统 或 裸 机 打交道 。 操 作 系 统 主 要 由 C 语 言 实 现 ， 包 括 UNIX、 
Linux、Windows 内 核 。 所 以 ，Rust 程 序 在 和 外 部 环境 “打交道 ”的 时 候 ， 
无 论 Rust 编 译 占 有 多 么 智能 和 强大 ， 痢 很 难 检 测 到 外 部 环境 涉及 的 内 存 
安全 问题 。 

不 妨 打 个 比方 。Rust 束 像 古 一 艘 邀 游 于 太空 的 宇宙 飞船 ， 不 窒 外 大 
2H fel, FARR BE CAR, WEZEN. SFP NRBSE 
飞 骨 外 执行 任务 时 ， 束 必须 窗 好 宇航 服 ， 经 由 减 压 舱 到 达 飞 船 外 部 。 宇 
航 员 一 旦 进入 外 太 容 ， 束 必须 目 己 你 证 安全 ， 因 为 此 时 他 已 完全 骏 露 于 
不 安全 的 环境 之 下 。 

严格 地 说 ，Rust 语 言 可 以 分 为 Safe Rust 和 Unsafe Rust 两 部 分 。 
Safe Rust 束 是 提供 安全 旗 护 的 “宇宙 飞船 ?， 而 Unsafe Rusti“ FILAR 
减 压 船 ， 以 及 飞船 外 部 与 宇航 员 有 一 切 关 联 的 部 分 ”。 

Safe Rust 涵 兰 了 前 面 章 节 中 所 介绍 的 内 容 ， 包 括 类 型 系统 和 所 有 权 
等 静态 分 析 机 制 。 在 使 用 Safe Rust 的 时 候 ， 开 发 者 完全 不 必 担 心 有 内 存 
不 安全 的 问题 出 现 。 但 是 当 和 需要 和 其 他 语言 交互 ， 其 至 与 底层 操作 系统 
或 便 件 设备 交互 的 时 候 ， 残 只 能 依靠 另外 一 父 “ 语 言 >， Unsafe Rust. 
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Unsafe Rust 是 Safe Ruth — NES. Em Æw, “EUnsafe Rust 中 ， 
并 不 会 禁用 Safe Rust 中 的 任何 安全 检查 。 如 代码 清单 13-1 所 示 。 


代码 清单 13-1: unsafe 块 中 使 用 引用 依旧 会 进行 借用 检查 


1. £ü main() { 
Bie unsafe { 
35 let mut a = "hello"; 
4. let b = &a; 
Bes let c = &mut a; 
6. } 
Ta } 


代码 清单 13-1 中 ， 在 unsafe 块 中 同时 对 变量 a 进 行 不 可 变 借 用 和 可 变 
信用 ， 这 违反 了 信用 规则 ， 编 详 需 会 报错 。 所 以 ， 即 使 在 Unsafe Rust 
下 ， 如 果 依 旧 编 写 Safe “Rust 的 代码 ， 也 完全 可 以 保证 茶 种 程度 的 安全 
性 。 

Unsafe Rust 是 指 在 进行 以 下 五 种 操作 的 时 候 ， 并 不 会 提供 任何 安全 
WEA. 

- HEI FR TET o 

- 调用 unsafe 的 函数 或 方法 。 

-V REAT ERSTE. 

- 实现 unsafe trait. 

- £5 Union 联合 体 中 的 字段 。 

这 五 种 操作 基本 上 适用 于 Rust 和 外 部 环境 “打交道 ”的 所 有 场景 。 对 
于 这 些 场景 的 操作 来 说 ，Rust 的 安全 检 答 完全 无 用 武之 地 ， 反 而 会 是 一 
ARS. ECON S| FARR EPA ee, The ee PS a SR eT BR ESAT 
此 时 就 会 造成 未 定义 行为 ， 即 便 此 时 编译 器 会 进行 安全 检查 ， 代 码 也 无 
法 通过 编译 ， 从 而 也 融 完 全 无 法 和 外 部 环境 “打交道 ?> 了。 所以， 针对 这 
五 种 操作 ， 就 完全 不 提供 任何 安全 检查 。 

Unsafe Rust 和 Safe Rust 的 区 分 市 来 以 下 三 方面 结果 : 


- Unsafe Rust 由 于 不 需要 安全 检查 ， 意 味 看 有 一 定 的 性 能 提升 。 

- Unsafe Rust 内 存 安全 完全 区 由 开发 者 来 保证 ， 人 否则 会 出 现 未 定义 
行为 。 

区 分 了 编译 硕 和 开发 者 的 职 贡 ， 如 果 代 但 出 现 了 问题 ， 可 以 先 排 

A Unsafe Rust 的 代码 。 

XERE SRA, BARA. EEA., Unsafe Rust 的 存在 并 
不 与 Safe Rust 相 矛盾 ， 也 不 与 Rust 语 言 保证 内 存 安 全 的 目标 相 神 突 。 反 
M a Unsafe RustH) 4£7£ Bt S Rust. 


13.1.1 Unsafe 语 法 


通过 unsafe 关 键 字 和 unsafe 块 就 可 以 使 用 Unsafe Rust， 它 们 的 作用 如 
下 : 

` unsafe 关 键 字 ， 用 于 标记 (或 者 说 声明 ) 图 数 、 方 法 和 trait。 

- unsafe 块 ， 用 于 执行 Unsafe Rust 允 许 的 五 种 操作 。 

unsafe 关 键 字 

Rust 标 准 库 中 包含 了 很 多 被 unsafe 天 键 字 标 记 的 图 数 、 方 法 和 trait。 
以 String 中 实现 的 函数 来 说 ， 如 代码 清单 13-2 所 示 。 

代码 清单 13-2: String 中 内 置 的 unsafe 函 数 示 意 
VE) 
String { vec: bytes } 

Se J 

Sais 13-2 F ems T String N E WJunsaferk 2¢from_utf8_ unchecked 
的 源码 实现 。 其 函数 签名 包含 了 unsafe 关 键 字 ， 该 图 数 接 收 一 个 Vec 去 
u8 之 类 型 的 字 节 数组 ， 返 回 一 个 String 类 型 。 

乍 一 看 ， 访 函数 中 只 是 简单 地 返回 一 个 String 结 构 体 实例 而 已 ， 也 
没有 进行 Unsafe “Rust 人 允许 的 那 五 种 操作 中 的 任意 一 种 ， 完 全 是 正 第 的 
Safe ”Rust 代码， 而 且 也 在 编译 占有 的 安全 检查 之 下 。 那 么 这 里 为 什么 用 
unsafe 关 键 字 来 标记 访 图 数 昵 ?因为 该 图 数 并 未 对 传 入 的 参数 bytes 进 
行 任何 合法 性 验证 ， 如 果 传 入 的 是 一 个 非法 的 UTF-8 字 市 序列 ， 则 会 出 
现 内 存 不 安全 的 问题 。 换 句 话 说 ， 残 是 使 用 该 图 数 时 有 可 能 会 及 生 违 


ERA WY UY o 

K% from_utf8 unchecked ”的 “契约 ”是 指 ， 传 入 的 参数 是 有 效 的 
UTF-8 ”有 字 贡 序列。 这 陨 是 unsafe 天 键 字 存 在 的 晶 义 。 访 图 数 航标 记 上 
unsafe 之 后 ， 使 用 广 函 数 的 开 肥 者 怠 会 主动 去 了 解 这 一 “ 右 约 ”， 看 看 当 
前 的 使 用 是 人 否 满足 “ 娘 约 ”的 要 求 。 如 末 开 及 者 没有 做 到 满足 “ 娘 约 ”的 要 
求 ， 将 来 出 现 了 问题 ， 也 可 以 在 unsafe 标 记 的 范围 内 排 租 问题 。 

所 以 ， 在 使 用 Rust 编写 一 个 函数 的 时 候 ， 需 要 注意 该 函数 在 使 用 
的 时 候 是 个 存在 违反 “契约 ”的 风险 。 如 采 存 在 风险 ， 请 使 用 unsafe 天 键 
字 将 其 标记 出 来 ， 在 其 他 人 使 用 该 函数 时 ， 束 可 以 多 加 注意 。 这 里 最 大 
的 风险 在 于 ， 如 果 一 个 函数 存在 违反 “四 约 ”的 风险 ， 而 开 友 者 并 没有 使 
用 unsafe 关 键 字 将 其 标记 ， 那 该 函数 束 很 可 能 会 成 为 Bug 的 “温床 ”。 

除 标记 函数 或 方法 外 ，unsafe 也 用 于 标记 trait 。 

Prive ee FOL unsafe trait 有 Send 和 Sync 。 编 详 需 依赖 Rust 内 置 
的 类 型 和 内 部 严格 的 规则， 为 开发 者 目 定 义 的 类 型 目 动 实现 这 两 个 
trait， 这 是 Rust 能 保证 并 友 安 全 的 基石 。 使 用 unsafe 对 Send 和 Sync 进行 标 
i, PRR RH FIKI EZA TERNE 

标准 库 中 另外 一 个 unsafe trait 束 是 std: : str: : pattern: : 
Searcher ， 在 字符 串 章 节 中 已 介绍 过 它 ， 它 是 字符 串 搜 索 模 式 的 抽象 ， 
提供 了 一 系列 方法 ， 行 为 像 欠 代 需 。 如 代码 清单 13-3 所 示 。 

代码 清单 13-3: Searcher 示 意 


1 pub unsafe trait Searcher<'a> { 

Lav fn next(&mut self) -> SearchStep; 
3 fi ame 

4 } 


代码 清单 13-3 中 展示 了 Searcher 产 人 码 示 意 ， 它 是 一 个 unsafe trait。 这 
里 unsafe 标 记 的 为 什么 是 trait 而 不 是 方法 next 呢 ? 

这 是 因为 要 实现 Searcher 里 的 next 方法 ， 必 须要 保证 其 返回 的 索 
引 位 于 有 效 的 ”UTF-8 边 界 上 ， 谷 则 会 出 现 内 和 存 不 安全 的 问题 。 而 依据 
Searcher 的 工作 机 制 来 看 ，next 方 法 并 不 会 引起 任何 内 存 不 安全 问题 ， 
只 是 它 的 返回 结果 在 另外 一 个 地 方 使 用 才 会 发 生 问 题 。 而 考 碟 到 字符 串 
检索 的 性 能 ，Searcher 也 不 想 对 结果 进行 检查 。 所 以 ， 这 里 只 能 给 trait 加 


上 unsafe 标 记 ， 以 此 来 警告 实现 该 trait 的 开发 者 在 实现 该 trait 时 必须 加 守 
这 些 条 件 。 另 外， 在 实现 unsafe _ trait 的 时 候 ， 也 必须 相应 地 使 用 unsafe 
impl 才 可 以 。 
unsafe 块 
4% unsafe 天 键 字 标 记 的 不 安全 图 数 或 方法 只 能 在 unsafe 块 中 被 调 
用 。 如 代码 清单 13-4 所 示 。 
代码 清单 13-4:，unsafe 块 示意 


la fñ Maant) 1 
2 iet hello = vec! [104, LOL, 108, 108, Lill: 
Su let hello = unsafe { 
4 ptring::from utis unchecked (hello) 
3. }; 
Gs assert eq? holLlo” x lel loyp 
Tx J 


代码 清单 13-4 中 使 用 from_utf8_unchecked 函 数 将 字 节 数组 转 为 字符 
串 ， 这 里 必须 使 用 unsafe 块 ， 人 否则 会 报 如 代码 清单 13-5 所 示 的 错误 。 
代码 清单 13-5: RIE H unsafetk ii] H unsafe K 242 tk fa 


error[E0133]: call to unsafe function requires unsafe function or block 
—<> Se maip rg 
| String::from utf8 unchecked (hello); 


| NANKAKAAKAAAAANAAAKAAAAKAAAAKAAAAKAAAAAAAAARKAM 


call to unsafe function 

从 代码 清 蛙 13-5 中 看 得 出 来 ， 在 未 使 用 unsafe 抉 的 情况 下 就 调用 
unsafe ži, mikaa ikt. Eh H unsafe, SIRE EIEN RE 
tunsafe K HM ZERE SOR, ETHAIR. 


除 调用 不 安全 国 数 或 方法 外 ，unsafe 块 也 可 以 进行 其 他 操作 。 
13.1.2 访问 和 修改 可 变 静 态 变量 


静态 变量 是 全 局 可 访问 的 。 对 于 不 可 变 静 态 变量 来 说 ， 访 问 它 不 存 
在 任何 安全 问题 。Rust 也 人 允许 定义 可 变 的 静态 变量 ， 但 是 试想 一 下 ， 如 
果 多 个 线程 同时 访问 这 个 可 变 静 态 变量 ， 会 发 生 什 么 ? 答案 是 : 会 引起 
数据 竞争 。 这 是 Rust 安 全 检查 绝对 不 允许 发 生 的 事情 。 
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操作 ， 以 此 来 警示 该 操作 属于 不 安全 行为 ， 开 发 者 必须 保证 其 安全 。 如 
代码 清单 13-6 所 示 。 

代码 清单 13-6: 访问 和 修改 可 变 静 态 变 量 必须 在 unsafe 块 中 


‘|e static mut COUNTER: u32 = OQ; 


2 fn main(}) { 

3 let inc = 3; 

4. unsafe { 

5 COUNTER += ine? 

6 praintin! (COUNTER: ({}", COUNTER) 3 
7 } 


8. } 
ais 4413-67 EX T A Aba ASAE SECOUNTER, J Æunsafetk H x} 
其 进行 修改 和 访问 。 如 果 此 时 不 使 用 unsafe 块 ， 编 译 占 束 会 报错 提示 你 
应 该 使 用 unsafe 块 来 操作 可 释 前 态 变 量 。 
一 般 情 况 下 ， 很 少 有 人 使 用 可 变 静 态 变量 ， 但 是 要 和 其 他 语言 交互 
(尤其 是 C 语 言 ) 的 时 候 ， 可 变 静 态 变 量 束 会 非常 有 用 ， 在 后 和 面 与 C 交 
互 的 内 容 会 有 更 详细 的 介绍 。 


13.1.3 Union 联 合体 


Rust 也 提供 了 像 C 语 言 中 那样 的 Union 联 合体 。Union 和 Enum 相 似 ， 
Enum 属 于 Tagged Union， 优 点 在 于 其 存储 的 Tag 可 以 保证 内 存 安 全 ， 缺 
点 是 Tag 要 占用 多 余 的 内 存 空 间 。 而 Union 并 不 需要 多 余 的 Tag, WR 
想 访 问 其 中 的 字段 ， 就 必须 徘 程序 逻 辑 来 保证 其 安全 性 ， 如 果 访 问 错 
ik, Mes ARRIETA. MA, EWR æ Enum f Aza, mR 
点 是 使 用 起 来 不 安全 。 

Union 的 内 存 布 局 和 Enum 也 是 相似 的 ， 字 段 共 用 同一 片 内 存 罕 
屠 ， 所 以 也 被 称 为 共用 体 。 内 存 对 齐 方 式 也 是 投 字 段 中 内 存 占 用 最 大 的 
关 型 为 主 。Rust 里 引入 Union 的 主要 原因 还 是 为 了 方便 Rust 和 C 语 言 “ 打 
交道 ”。 如 代码 清单 13-7 所 示 。 

代码 清单 13-7: 使 用 Union 联 合体 和 Struct 模 拟 Enum 关 型 


# [repr (C) ] 
union U { 
Le Tey 
te Loe 
# [repr (C) ] 
struct Value{ 
tags 0; 


> RO —] CfA fF ch RR I EF 


oat 
Oo - 


value: U, 
T 
. #[repr(C) ] 
. union MyZero { 


Ls fa. a9 
wW BP e 


l: Value, 
f: Value, 


r es 
GA i 


7 

. enum MyEnumZero { 
dig ee 
E(f3Z) , 


Bk -ES ta a 
io co md ay 


- | 

» IH taint) t 

al let int 0 = MyZero{i: Value{tag: b'0', value: UV {1107} }y 
ee let float. 0 = MyZere{1s Value{tag: b'l", value: U { £; 0.0 } } }; 
wow d 


代码 清单 13-7 中 使 用 Union 和 Struct 来 模拟 一 个 Enum 类 型 MyZero。 
该 类 型 的 特点 是 ， 可 以 同时 存储 整数 0 和 学 点 数 0.0。 

代码 第 1 一 5 行使 用 union 天 键 字 定义 了 Union 联 合体 ， 包 舍 两 个 字段 i 
和 f， 用 i32 和 人 2 关 型 分 别人 代表 整数 和 浮 点 数 。 当 使 用 Union 联 合体 时 ， 
配合 使 用 了 #[repr (C) ] 属性 是 必需 的 ， 访 属性 会 告诉 Rust 编 详 需 ， 
此 联合 体 应 该 使 用 和 C 语 言 一 样 的 内 存 布 局 2 WRAD [repr (C) ] 属 
性 ， 则 有 可 能 发 生 未 定义 行为 。 

代码 第 6 一 10 行 定义 了 结构 体 Value， 包 侣 tag 字段 和 value 字 段 ， 是 
为 了 模拟 Enum 类 型 中 的 值 。 因 为 Enum 类 型 中 的 每 个 值 还 包含 一 个 tag。 
此 处 也 必须 为 结构 体 Value 使 用 #[repr (C) ] 属 性 ， 因 为 value 字 上 段 是 联 


INO 
ae 


合体 类 型 U。 

代码 第 11 一 15 行 定义 了 MyZero 联 合体 ， 包 含 两 个 字段 i 和 f， 它 们 的 
类 型 均 为 Value。 该 联合 体 相 当 于 代码 第 16 一 19 行 定义 的 一 个 Enum 类 型 
MyEnum Zero. 

然后 束 可 以 在 main 疯 数 中 使 用 MyZero 了 ， 每 次 使 用 一 个 值 。 需 要 
注意 的 是 ， 代 但 清单 13-7 并 不 能 正 弟 编译 运行 。 因 为 当前 版 本 的 Rust 不 
文 持 Union 联 合体 的 字段 为 非 Copy (Non-Copy) 类 型 ， 联 合体 MyZero 
中 的 字段 束 是 非 Copy 类 型 。 如 果 使 用 # ! 
[feature (untagged_unions) ] 特性， 该 段 代 码 就 能 正 第 编译 ， 不 久 的 
将 来 该 特性 会 稳定 。 

接 下 来 对 代码 清单 13-7 做 一 次 重 构 ， 让 它 可 以 正 背 运行。 如 代码 请 
单 13-8 所 示 。 

代码 清单 13-8: 对 代码 清单 13-7 进 行 重 构 


Oo O0 =J “GY Go th tw PY FF 
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# [repr (u32) ] 

enum Tag { I, F } 
# [repr (C) ] 

union U { 


# [repr (C) ] 
struct Value { 
tag? Tag; 
u: ud, 
} 
Pi. 18 zZervo(vi Value) -> Bool 4 
unsafe { 
match v { 
Velie i Cage Taoiscly We U0 4 2 
Valve { Tags Tagitr, us UT f: 
_ = Tales, 


} 

fn. maim{) { 
let int 0 = Valueitag? Tagetl, me Util: UJJ? 
ler LOS 0 = Valne[ tag? Tog UE UNC? Use 
assert egi (trues, Ls Zere(1Ht 0) }; 
assert eq! (true, is_zero (float. 0)); 
assert egi (dy BStradsymemitsize of: e<Ur() ); 


代码 第 1、2 行 定义 了 Enum 枚 举 体 Tag， 包 含 1 和 FE 两 个 值 ， 分 别 代 表 


MOAT AL. VER, EEH Y A [repr 32) ] 属 性 来 指定 布局 ， 如 来 
不 使 用 该 属性 ， 则 默认 是 Rust 类 型 。 因 为 该 枚 举 体 准备 在 联合 体 中 使 


用 ， 


所 以 必须 指定 好 布局 ， 人 否则 可 能 会 出 现 未 定义 行为 。 
代码 第 3 一 7 行使 用 union 天 键 字 定义 了 联合 体 U， 包 含 字 段 1 和 f， 同 


代码 清单 13-7 中 一 样 。 

代码 第 8 一 12 行 定义 了 结构 体 Value， 包 含 字段 tag 和 u， 分 别 是 Tag 
和 U 类 型 。 该 结构 体 所 指 代 的 意义 和 代码 清单 13-7 中 一 致 。 

代码 第 13 一 21 行 定义 了 is_zero 图 数 ， 该 函数 传 入 Value 类 型 的 参 
数 ， 人 返回 布尔 值 ， 目 的 是 为 了 判断 传 入 的 Value 是 否 为 零 。 整 数 零 和 浮 
上 所 数 零 均 会 返回 true。 注 意 ， 该 闵 数 中 对 Value 可 能 的 值 进 行 了 岂 配 ， 包 
舍 在 unsafe 块 中 。 对 联合 体 U 的 字段 进行 操作 是 不 安全 的 行为 ， 所 以 必 
须 放 到 unsafe 块 中 。 男 外 ， 代 码 第 17 行 有 浮 点 数字 和 面 量 参 与 风 配 ， 在 编 
译 时 会 发 出 警告 ， 该 问题 暂时 可 以 忽略 ， 这 里 只 作为 教学 示例 ，Rust 官 
方 也 正在 完善 此 问题 。 

代码 第 22 一 28 行 的 main 函数 中 ， 声 明了 int_ 0 和 float_0 两 个 Value 的 
实例 ， 调 用 is_zero 函 数 均 得 到 了 预期 的 结果 。 代 码 第 27 行 验证 了 联合 体 
U 的 内 存 对 齐 是 4 字 季 ， 和 预期 的 一 致 ， 并 没有 占 空间 的 tag 。 

联合 体 和 枚 举 体 一 样 ， 每 次 只 能 使 用 一 个 字段 ， 因 为 联合 体 中 的 字 
段 均 共用 内 存 空 间 。 如 果 不 小 心 使 用 了 未 初始 化 的 字段 ， 则 可 能 发 生 未 
定义 行为 。 如 代码 清单 13-9 所 示 。 

代码 清单 13-9: 访问 联合 体 中 未 初始 化 的 字段 


# [repr (C) | 


union. U 4 


fn. maim) 4 
let o = Uti: Li; 


let 1 =unsafe{ 


wt 
LD yi 
Lis // 0.000000000000000000000000000000000000000000001 
LZ s Pee te se oe 
13. // unsafe{ 
14. // let i = émut u.i; 
18, // let f = &mut u.f; 
16, AY p? 
Lae 


代码 清单 13-9 中 定义 了 联合 体 U， 在 main 函 数 中 定义 了 U 的 实例 。 
在 代码 第 9 行 ， 本 来 应 该 访问 字段 1， 但 是 这 里 错误 地 访问 了 字段 f， 导 致 
第 12 行 的 输出 为 第 11 行 注释 中 的 浮 点 数 。 

值得 注意 的 是 ， 代 人 码 第 12 行 的 输出 等 价 于 f32: : from_bits (1) K 
数 调用 。 在 当前 示例 中 ， 访 输出 属于 正常 的 输出 ， 不 属于 未 定义 行为 。 
但 是 广义 地 看 ， 这 种 用 法 是 不 安全 的 ， 在 某 些 应 用 场合 下 很 可 能 会 造成 
不 可 预期 的 结 

代码 第 13 一 16 行 被 注释 的 原因 是 它们 会 报错 。 对 于 一 个 联合 体 来 
说 ， 不 能 同时 使 用 两 个 字段 ， 当 然 也 不 能 同时 出 借 两 个 字段 的 可 变 借 
用 。 虽 然 可 以 同时 出 借 两 个 不 可 变 借用 ， 但 这 种 用 法 依旧 不 安全 ， 没 有 
人 会 故意 这 样 使 用 。 


13.1.4 解 引 用 原生 指针 


Rust 提 供 了 *const T (Æ) 和 *mut T (可 变 ) 两 种 指针 类 型 。 
为 这 两 种 指针 和 Ci 语言 中 的 指针 十 分 相近 ， 所 以 叫 其 原生 指针 (Raw 


Pointer〉。 原 生 指 针 具 有 以 下 特点 : 

` 并 不 保证 指 问 合法 的 内 存 。 比 如 很 可 能 是 一 个 空 指 针 。 

“ 不 能 像 智 能 指针 那样 目 动 清理 内 存 。 需 要 像 C 语 言 那样 手动 党 理 
内 存 。 

”没有 生命 周期 的 概念 ”“。 也 融 是 说 ， 编 详 央 不 会 对 其 提供 信用 检 
er 

不 能 保证 线程 安全 。 

可 见 ， 原 生 指 针 并 不 受 Safe Rust 提 供 的 那 一 层 “ 安 全 外 衣 ” 保 护 ， 所 
以 也 被 称 为 “ 裸 指 针 ”。 所 以 ， 在 对 裸 指针 进行 解 引 用 操作 的 时 候 ， 属 于 
不 安全 行为 。 如 代码 清单 13-10 所 示 。 

代码 清单 13-10: 解 引 用 裸 指针 是 不 安全 行为 


1. fn main() { 

ae let mut s = “hello”™.to string (); 
Sx let rl = &S as *const String; 

4. let r2 = &mut s as *mut String; 
Da assert eg! (rI, rZ); 

Cis let address = Ox/fff1d/2307d; 

7. let £3 = address as *eaonst String; 
2 unsafe { 

oF prancing ("rl 183 47", rL); 

ile pranmcln! (hr 158 47%, 2) 7 
li. // 段 错 误 
12 f! assert eq! (*rl, *r3) 
13. } 
14. } 


Ais 13-104 (RAGS 2~477, Waste EAP Ee ees A A 26 | 
用 和 可 变 引 用 分 别 转换 成 不 可 变 裸 指针 *const String 和 可 变 裸 指针 *mnut 
String  。 注 章 ， 这 里 同时 出 现 了 不 可 变 和 可 变 的 指针 ， 但 它们 不 是 引 
用 ，Rust 借 用 检查 会 对 它们 “用 一 只 眼 ， 闭 一 只 有 眼 *”。 创 建 裸 指针 本 号 并 
不 会 触发 任何 未 定义 行为 ， 所 以 不 需要 放 人 到 unsafe 块 中 操作 。 

代码 第 5 行 验证 裸 指针 r1 和 Tr2 是 含 相 同 。 事 实 上， 它们 是 相同 的 。 


代码 第 6、7 行 通过 随意 指定 一 个 地 址 address， 以 及 as 操作 符 重 新 创 
建 了 一 个 裸 指 针 r3。 

代码 第 9、10 行 通过 “*” 操 作 符 对 rl1 和 7r2 进 行 解 引用 ， = 
串 s 的 内 容 。 但 这 个 操作 是 不 安全 的 ， 必 须 在 unsafe 块 下 进 

锐 注 释 的 代码 第 RE AN 
(Segmentation Fault〉。 因 为 r3 是 随意 定义 的 指针 ， 开 发 者 根本 无 法 确 
定 它 指 问 的 是 否 为 合法 内 契 。 


13.2 基于 Unsafe 进 行 安全 抽象 


通过 unsafe 关 键 字 和 unsafe 块 可 以 执行 一 些 跳 过 安全 检查 的 特定 探 
作 ， 但 并 不 代表 使 用 了 unsafe 右 人 不安 全。 在 日 党 开发 中 ， 人 往往 需要 在 
unsafe 的 基础 上 抽象 安全 的 函数 。 使 用 unsafe 块 的 函数 需要 满足 基本 
的 “和 契约 ”， 才 能 保证 整个 函数 的 安全 性 。 除 此 之 外 ， 还 需要 了 解 一 些 其 
他 的 概念 ， 才 能 更 安全 地 使 用 Unsafe Rust。 


13.2.1 原生 指针 


原生 指针 是 Unsafe Rust 中 最 钊 用 的 ， 它 主要 有 以 下 两 种 用 途 : 

在 需要 的 时 候 跳 过 Rust 安全 检查 。 有 些 情况 下 ， 程 序 馆 辑 完 
不 会 有 任何 内 存 安全 问题 ， 使 用 原生 指针 就 可 以 避免 那些 不 必要 的 安全 
检查 ， 从 而 提升 性 能 。 

与 C 语 言 “打交道 >” ， 需 要 使 用 原生 指针 。 

标准 库 为 原生 指针 内 建 了 很 多 方法 和 函数 ， 为 开发 者 利用 指针 进行 
各 种 控 作 提供 了 方便 。 在 此 主要 介绍 以 下 几 个 内 建 水 数 和 方法 : 

std: : ptr: : null 疯 数 和 is_null 方 法 

- offset 方法 

- read/write Ù Y% 

- replace/swap 方 法 

这 几 个 是 比较 第 用 的 函数 和 方法 ， 在 标准 库 原 生 指 针 模 块 中 还 有 其 
他 很 多 方法 ， 可 以 通过 相关 文档 人 查看 更 多 。 

创建 空 指 针 

创建 空 指针 并 判断 是 否 为 空 指针 的 实现 如 代码 清 日 13-11 所 示 。 

代码 清 单 13-11: 创建 空 指 针 并 判断 是 否 为 空 指针 


1 fn main() { 

2 iet pi “oonsb US = Sears pers nl 
3 assert! (pulls Hall (yl 

let s: &str = "hello"; 

Ba lét ptr: *const uS = 5.85 ptr); 

6 ES 

7 let mut s = [1l, 2, 3l? 

8 Let pter: müt. Wia = BBs MUE peet) s 
9 assert! IHE. 工 null ()); 


LO } 
代码 清单 13-11 中 的 代码 第 2、3 行 ， 通 过 std: : ptr 模块 提供 的 null 
函数 可 以 创建 一 个 空 指针 ， 通 过 is_null 方 法 可 以 判断 其 是 否 为 空 。 
代码 第 4 一 6 行 ， 通 过 &str 关 型 字符 串 s 的 as_ptr 方 法 得 到 一 个 不 可 变 
原生 指针 ， 访 指针 指 同 合法 的 扒 内 存 ， 所 以 它 不 是 一 个 空 指 针 。 注 总， 
第 5 行 指针 ptr 的 类 型 为 sconst u8 ， 这 是 因为 字符 串 是 以 字 节 为 单位 存储 
的 。 
代码 第 7 一 9 行 ， 通 过 数组 s 的 as_mnut_ptr 方 法 得 到 类 型 为 smut u32 的 
可 变 原 生 指 针 ， 因 为 数组 中 的 元 素 为 数字 类 型 。 同 样 ， 它 也 不 是 空 指 
ET o 
在 创建 空 指针 的 时 候 ， 并 不 会 引起 任何 未 定义 行为 ， 所 以 这 里 并 没 
有 使 用 unsafe 块 。 
使 用 offset 方 法 
顾名思义 ，offset Siete ee eS ， 通 过 该 方法 可 以 指定 相对 于 指针 
地 址 的 偏 移 字 节 数 ， 从 而 得 到 相应 地 址 的 内 容 。 如 代码 清 蛙 13-12 所 
A 
代码 清单 13-12: 使 用 offset 方 法 


fn main() { 
let s: &str = "Rust"; 
let Pers *COnsSt US = 8.486 PCr) s 
unsafe { 


peintin! (*{22}", *ptr.offset(1) as char); // ü 
printin! (*"{:2?}", *ptr.offset(3) as char); // t 
princin! "Ie ss FprereOrfrset (255) as char); Fr 9 


Oo Ons HD OF e W ND FF 


i 
代码 清单 13-12 中 ， 代 但 第 2、3 行 得 到 一 个 *const u8 类 型 的 不 可 变 
指针 ptr， 访 指针 指 回 字符 串 s 的 起 始 字符 。 然 后 通过 offset 方 法 获 取 字 人 符 
串 s 中 的 其 他 字符 。 

代码 第 4 一 8 行 ， 因 为 offset 方法 是 unsafe 方法 ， 所 以 要 在 unsafe 
块 中 调用 。 其 中 “*ptr.offset (1) as char ”等 价 于 “* (ptr.offset (1) ) 
as char ”。 上 和 而 之 所 以 可 以 和 省略 括号 ， 是 因为 解 引 用 操作 优先 级 低 于 方 
法 调用 ， 但 高 于 as 操 作 人 从 。 退 过 给 offset 方 法 指定 偏 移 量 〈 以 字 节 为 时 
位 )， 束 可 以 得 到 相应 的 字符 。 代 人 码 第 5、6 行 分 别 得 到 字符 u 和 t。 

因为 offset 方法 并 不 能 保证 传 入 的 偏 移 量 是 合法 的 ， 如 末 超 出 了 他 
符 串 的 边界 ， 吏 可 能 会 产生 未 定义 行为 ， 所 以 该 方法 被 标记 为 unsafe 方 
法 。 如 代码 第 7 行 所 示 ， 打 印 出 的 字符 完全 是 不 可 预料 的 。 

使 用 read/write 方 法 

通过 read 和 write 方法 可 以 谈 取 或 号 入 指针 相应 内 存 中 的 内 容 。 注 
意 ， 这 两 个 方法 也 是 unsafe 方 法 。 人 代码 清单 13-13 展 示 了 read 方 法 的 使 


二 


代码 清单 13-13: 使 用 read/write 方 法 


Te En Nf 

en Let x = "hello wee string () ; 

Ss let y: *ounst us = ras ptr)+s 

4. unsafe { 

Sa assert eqi (y.rsead() as char, "“h’) 7 
Ss } 

Ts let [Vs Ly Ry Sle 

8. let [al DEI) aS OmerL Lu 4]? 
Bs unsafe { 

LU. assert. eq! (y.read(), [0,1,2,3]) 7 
Ls } 

l2; let x = vec! (0, Ty 2, al} 

la. let y = &x as *const Vec<1i32>; 

14. unsafe { 

15s assert eg! (y.tead(), [Useleersli¢ 
16% } 

j ei BS Ler MOE xk = mu; 

L8 a let y = &mut x as “mut str; 

Ia let z = "hello"; 

20 unsafe { 

el y.write(z); 

BA s assert eq! (y-read{)]; "neLlo™)y 
23s } 

24. } 


代码 清单 13-13 中 第 2 行 定义 了 String 类 型 字符 串 x， 代 码 第 3 行 通过 
调用 x 的 as_ptr 方法 得 到 其 指 同 堆 内 存 的 原生 指针 ， 因 为 String 类 型 本 
质 是 一 个 字 节 序列 数组 ， 所 以 该 指针 类 型 是 xconst u8 ， 指 同 第 一 个 字 
节 序 列 。 第 4 一 6 行 在 unsafe 块 中 调用 指针 y 的 read 方 法 ， 获 取 到 字符 串 的 
第 一 个 字符 ， 并 将 其 转换 为 字符 类 型 ， 与 预期 的 字符 进行 比较 。 

注意 ，read 方 法 是 unsafe 方 法 ， 这 是 因为 read 方 法 通过 指针 来 读 取 当 
前 指针 指 同 的 内 存 ， 但 不 会 转移 了 所有权。 也 就 是 说 ， 在 该 指 针 读 取 完 内 
仔 之 后 ， 该 内存 有 可 能 会 被 其 他 内 容 窗 新 。 

代码 第 7 一 11 行 定义 了 固定 长 度数 组 x， 并 通过 调用 as_ptr 方 法 得 到 


类 型 为 *const [u32; 4] 的 原生 指针 y。 通 过 调用 y 的 read 方 法 ， 可 以 谈 取 
到 数组 的 内 容 。 注 意 ， 这 里 的 原生 指针 类 型 是 珊 长 上 度 的 ， 如 有 果 将 类 型 改 
为 *const [u32; 3] ， 则 通过 read 方 法 只 能 试 取 到 前 三 个 元 系 的 值 。 

代码 第 12 一 16 行 定义 了 一 个 动态 数组 x， 但 这 次 并 没有 用 as_ptr 获 取 
指 同 堆 内 存 的 原生 指针 ， 而 是 直接 将 x 的 引用 通过 as 操 作 符 转换 为 原生 
指针 。 这 次 调用 访 指 针 的 read 方 法 谈 出 来 的 并 不 是 访 动 态 数 组 的 第 一 个 
元 系 ， 而 是 全 部 元 系 。 

要 注意 通过 as_ptr 获 取 和 由 引用 转换 为 原生 指针 的 区 别 。 通 过 as_ptr 
得 到 的 指针 是 字符 串 或 数组 内 部 的 指 同 存放 数据 堆 ( 或 栈 ) 内 存 的 指 
针 ， 而 引用 则 是 对 字符 串 或 数组 本 号 的 引用 。 

对 应 于 read 方 法 ， 人 代码 第 17 一 23 行 展示 了 write 方法 的 使 用 。write 方 
法 会 缆 着 揉 指 定位 置 上 内 存 的 内 容 。 同 理 ，write 方 法 也 属于 unsafe 方 
yo 

使 用 replace/swap 方 法 

利用 replace 或 swap 方 法 ， 可 以 快速 将 换 指 定位 置 的 内 存 数据 。 如 代 
人 码 清单 13-14 所 示 。 

代码 清单 13-14: 使 用 replace/swap 方 法 


le ER Man i 

fe let mut. vr Vee<isz> = vec! (1, 2]; 

Sy let ¥ ptr ù tmut 134 = yaas mut ptr()} 

4. unsafe{ 

oe lët alad ¥ = y Ptr. replace (a) J 

Os assert eq! (1, old v); 

Ts assert e@qictls, 2le &Vlawlls 

P } 

os Let Mut. SE Vec<i3s2> = yegi [1, z2)]F% 

LW » Llet v ptr = émut v as *mut. Vee<i32>; 

Lla unsafe{ 

12 3 let. Ola y = y Ptrareplace (Vee, Lrdapa) i 7 
Le a aseerre Sq! ((l, 2], #e1d W[..])¥ 

14. assert. eq! ([3S, Mr Sly, &v[es]]?F 

L5; } 

Lo let mut array = [0, 1, 2, 3]; 

ok iat 3 = akray[O...].28, MIT PEE() as “Mr [U] 2]} 
13. let y = arvray|l..].as_mut per() as *mut [u32; 2]; 
19s unsafe { 

20. assert eq! C(O, lly Ke®ead())F 

E 。 assert BT (l1, 2]; Yedda ())}F 

22 s x.swap (y); 

AS s assert eq! ([lz 0, dy 3], array); 

24. } 

a } 


代码 清单 13-14 中 ， 第 2、3 行 通过 as_mnut_ptr 得 到 动态 数组 v 中 指 回 
扒 内 存 的 可 变 原 生 指针 ， 所 以 该 指针 指 回 动 态 数组 的 第 一 个 元 系 。 第 4 
一 8 行 ， 在 unsafe 块 中 使 用 replace JAVIER SICA SHAS. KA 
法 会 返回 旧 的 值 ， 所 以 old_v 的 值 是 1， 而 动态 数组 v 就 变 成 了 [5，2]。 

第 9 一 15 行 同样 是 动态 数组 v， 但 只 是 将 v 的 可 变 引 用 转换 为 了 可 变 
原生 指针 ， 该 指针 指 同 数组 的 全 部 元 紊 。 所 以 在 unsafe 块 中 使 用 replace 
方法 ， 传 入 的 参数 是 整个 Vec<i32> 之 类 型 的 动态 数组 ， 而 非 单个 元 素 。 

代码 第 16 一 24 行 展示 了 swap 方法 的 使 用 ， 该 方法 接收 两 个 可 变 原 


生 指 针 作 为 参数 ， 并 将 其 指 加 内存 位 置 上 的 数据 进行 互 换 。 
代码 第 16 一 18 行 定义 了 固定 长 度数 组 array， 并 使 用 as_mut_ptr 得 到 
两 个 可 变 原生 指针 x 和 y， 类 型 均 为 *mut [u32; 2] 。 
代码 第 19 一 24 行 通过 read 方 法 可 以 得 到 x 和 y 的 数据 ， 分 别 为 [0，1] 
和 [1，2]。 然 后 调用 x 的 swap 方 法 与 y 互 换 数 据 ， 最 终 得 到 结果 [1，0， 
1，3]。 交 互 过 程 如 图 13-1 所 示 。 
m — BT 10, 1, 2, 3 


temp = xX 


[1,2 + va 1,2, 2, 3] 


| 


Te = oe (1,0, 1, 3] 





图 13-1: swap (x, y) WHORE 

从 图 13-1 可 以 看 出 ，swap 方法 因为 传 入 的 可 变 原 生 指针 都 来 自 同 
一 个 数组 ， 操 作风 内 存 区 域 有 重 闭 的 地 方 ， 这 种 操作 很 有 可 能 引起 内 
部 数据 混乱 ， 从 而 引发 未 定义 行为 ， 所 以 swap 也 是 unsafe 方 法 。 

在 std: : mem 模块 中 提供 了 一 个 安全 的 swap 方法 ， 其 图 数 签名 为 
fn swap<T> (x: &mut T, y: &mut T) ,注意 其 参数 为 可 灾 丰 
用 。 因 为 可 变 引 用 是 独占 的 ， 不 可 能 对 同一 个 变量 进行 两 次 可 变 借用 ， 
所 以 驶 保证 了 访 方 法 不 可 能 出 现 内 存 重 登 的 情况 。 同 样 ”“，std: : mem 
模块 中 也 提供 了 安全 的 replace 方法 。 

使 用 原生 指针 进行 安全 抽象 

在 标准 库 中 有 很 多 方法 是 基于 Unsafe Rust 实 现 的 安全 抽象 。 比 如 ， 
Vec<T> 动 态 数组 的 insert 方 法 。 假 设 使 用 Safe Rust 来 实现 insert 方 法 ， 
可 以 想象 得 到 ， 将 无 法 避免 要 使 用 多 次 &mut Vec<T>>， 这 是 完全 无 法 
做 到 的 。Safe Rust 的 借用 检查 不 允许 对 同一 个 变量 进行 多 次 可 变 信 用 。 
在 这 种 情况 下 ， 使 用 原生 指针 是 唯一 的 办 法 。 

代码 清单 13-15 展 示 了 Vec<T> 中 insert 方 法 的 源码 。 


代码 清单 13-15: Vec<T> 的 insert 方 法 源码 示意 


1 pub fn insert (&mut self, index: usize, element: T) { 
2 let len = self.len(); 

3 assert! (index <= len); 

4 if len == self.buf.cap() { 

es self.reserve (1); 

6 } 

7 unsafe { 

8 { 

9. let p = Seli.as MOC PEr() .ofiset (index as 18176) j 
LU ptr: :copy(p, Paol iset (i), den = andex); 
Lis ptr::write(p, element); 

Lz. } 

13. BELE ,SEE LEALES £ dy: 

bA } 

Lae 3 


代码 清单 13-15 中 ，insert 方 法 传 入 了 三 个 参数 : Smut self. index#l 
element， 分 别 表 示 Yec 二 了 T 过 的 实例 可 变 人 和 借用、 要 插入 位 置 的 索引 和 要 
插入 的 元 系 。 

代码 第 >、3 行 通过 断言 保证 了 index 的 值 不 能 超过 数组 长 度 len， 从 
而 保证 了 该 图 数 的 基本 “契约 ”: 插入 的 索引 不 能 越界 。 

代码 第 4 一 6 行 ， 判 断 数 组 的 长 度 是 个 达到 了 数组 的 容量 上 限 ， 如 果 
达到 ， 则 通过 reserve 方 法 来 扩容 。 传 给 reserve 的 参数 1 代表 每 次 扩展 一 
个 燃 型 大 小 的 字 节 数 。 

从 代码 第 7 行 开始 ， 在 unsafe 块 下 进行 操作 。 

代码 第 8 一 12 行 ， 将 这 三 行 代码 放 到 一 个 单独 块 中 是 因为 它们 表示 
一 个 完整 的 插入 侯 辑 。 代 人 码 第 9 行 通 过 as_mut_ptr 方 法 获取 到 实例 的 原生 
可 变 指 针 ， 和 再 进一步 通过 offset 方 法 和 index 的 值 ， 得 到 要 插入 位 置 的 指 
针 p。 人 代码 第 10 行 通过 ptr: : copy 方 法 将 当前 位 置 的 内 容 右 移 一 位 ， 这 
样 才 能 给 当前 位 置 留 下 衬 位 来 便于 插入 新 的 元 隶 。 代 但 第 11 行 使 用 
ptr: : write ZirS APTN ICR o 

代码 第 13 行 将 数组 的 长 度 加 一 。 至 此 ， 整 个 insert 方 法 才 算 完整 。 


综合 来 说 ，insert 方法 内 部 使 用 了 unsafe 块 直 接 操 作 原 生 指 针 ， 通 
过 断言 判断 指定 插入 的 index 无 法 越界 操作 ， 以 及 通过 判断 长 度 是 售 达 
到 容量 极限 来 决定 是 否 进行 扩容 。 如 果 没 有 这 两 个 判断 条 件 ，insert 方 
法 项 无 法 保证 安全 ， 它 残 不 是 一 个 安全 抽象 ， 束 必须 在 方法 签名 前 面 加 


Unsafe 标 俭 。 
13.2.2 子 类 型 与 型 变 


子 类 型 ” (subtype) 在 计算 机 科学 中 是 相对 于 夯 外 一 种 有 和 蔡 代 关系 
的 数据 类 型 ( 父 类 型 ，supertype) 而 言 的 。 一 般 来 说 ， 可 以 用 在 父 奖 型 
的 地 方 ， 也 可 以 用 子 交 型 来 将 代 。 在 类 型 理论 中 ， 子 类 型 天 系 一 般 写 为 
A<: B， 这 意味 看 A 是 B 的 子 类 型 。 

FEMI TRIB SF, FRA BMA FARE BAS (subtype 
polymorphism) , MILAR SRA ZAP, SEES FRO. 
比如 ， 在 需要 圆 形 工作 的 环境 ， 也 可 以 使 用 其 他 任何 圆 形 几何 体 〈( 比 如 
圆 环 ) ， 它 们 的 关系 可 表示 为 Ring<: Circle 。 在 面向 对 象 语言 中 ， 一 
WHERE) (Liskov Substitution Principle, LSP) 来 描述 这 种 关 
A: 所 有 引用 基 类 ( 父 类 ) 的 地 方 必 须 能 透明 地 使 用 其 子 类 的 对 象 。 通 
俗 地 说 ， 束 是 允许 子 类 可 以 方便 扩展 父 类 的 功能 ， 但 不 能 改变 父 类 原 有 
的 功能 。LSP 是 接口 设计 和 继承 复 用 的 基石 ， 人 巡 循 该 原则 可 以 让 代码 有 
更 好 的 维护 性 和 复 用 性 。 

型 变 的 基本 概念 

在 原始 类 型 的 基础 上 通过 类 型 构造 大 构造 更 复杂 的 类 型 时 ， 原 始 类 
型 的 子 类 型 天 系 在 复杂 类 型 之 上 如 何 变 化 ， 也 是 文 持 子 类 型 编程 语言 需 
要 考虑 的 问题 。 计 算 机 科学 中 把 这 种 根据 原始 次 型 子 关 型 关系 确定 复杂 
类 型 子 类 型 关系 的 规则 称 为 型 变 (variance) 。 比 如 ， 如 果 Cate 
Animal 的 子 类 型 ，Cat 类 型 可 以 出 现在 任何 需要 Animal 类 型 表达 式 的 地 
Jo ALAList<Cat> xe A AY VAL WL EList<Animal> Wik? 下 面 看 看 
型 变 的 三 种 形式 残 知道 答案 了 。 

型 变 一 般 可 以 分 为 三 种 形式 : 

- 协 变 (covariant) 。 可 以 继续 保持 子 类 型 天 系 。Cat 古 Animal 的 子 
FRAY, = ASAList<Cat> th 2 List< Animal > 的 子 类 型 。 


HAr  (contravariant) 。 逆 转子 类 型 关系 。Cat 是 Animal 的 子 类 
型 ， 那 么 List<Animal> 是 List< Cat> 的 子 类 型 。 

不 变  Ginvariant) . BEARER, TARR FRE K AR. Hate 
ii, Cat Animalf] r, {AList<Animal>#lList<Cat> RAK A 
的 。 

Rust 语 言 中 只 有 生命 周期 共有 子 类 型 关系 。 如 果 有 生命 周期 满 
E“ long: ”short "这样 的 天 系 ， 那 么 可 以 说 ”long 是 ”short 的 子 关 
型 。 这 个 关系 代表 生命 周期 "long 存活 的 时 间 比 ”short 要 长 ， 也 可 以 
说 ， 长 生命 周期 是 短 生 命 周 期 的 于 类 型 。 比 如 ，& ”static str 走 & a 
str 的 子 类 型 。 

了 解 由 生命 周期 组 成 的 复合 类 型 ， 具 体 什 么 样 的 型 变 规 则 很 重要 。 
因为 在 编写 Unsafe 代 码 的 时 候 ， 很 可 能 会 因为 没有 合理 使 用 型 变 而 造成 
未 定义 行为 。 

未 合理 使 用 型 变 将 会 引起 未 定义 行为 

代 人 码 消 时 13-16 展 示 了 目 定 义 的 内 部 可 变 类 型 。 

代码 清单 13-16: 目 定 义 内 部 可 变 类 型 MyCell<T> 


1 SEFUGCE MyCell<tT> 4 

2 value: T, 

oe d 

4 Inpl<T: Copy> MyCell<T> ¢{ 

5. fn new(x: T) -> MyCell<T> { 
6 MyCell { value: x } 

7 | 

8 fn gét(eselt) -> T í 

9. self.value 

LD a } 


Tis fn set(&self, value: T) { 

Lea use std::ptr; 

12 unsafe { 

14. ptr: write (tself Value as “const as *mut , value); 
Las } 

LO. } 

Lar 


代码 消音 13-16 中 这 1~~3 行 定义 了 泛 型 结构 体 MyCell<T 二 >， 包 含 一 
个 字段 value。 

代码 第 4 一 17 行 为 MyCell< 工 > 实现 了 new、get 和 set 三 个 方法 。 其 
中 ，new 和 get 方 法 没什么 特别 ， 午 点 是 set 方 法 。 

代码 第 11 一 16 行 在 set 方 法 中 使 用 了 unsafe 块 。 通 过 ptr: : write 方法 
将 当前 值 颖 副 为 新 传 入 的 仁 。 其 中 ptr: : write 的 第 一 个 参数 是 由 
&self.value 先 转 为 个 可 变 原 生 指 针 ， 再 由 不 可 变 原生 指针 转 为 可 释 原 生 
针 ， 因 为 Rust 个 允许 直接 将 不 可 变 借 用 转 为 可 变 原 生 指针 。 

MyCell<T> 看 上 去 暂时 没什么 问题 ， 接 下 来 实现 两 个 图 数 来 使 用 
它 ， 如 代码 清单 13-17 所 示 。 

代码 清单 13-17: 使 用 MyCell< 工 > 示例 


Le Iñ Stepl<*a>(r cl: «MyCell<é"a asz>) | 
Bu let vals 132 = 13; 
3s step2(&val, r olji 
4. PEInCLAI (“Step valne: 17", © Cl valter); 
oe } 
SC. frn stepz<"DS(r vale Sh 232, E Cos CMyCeLlieb DD Lazy) 4 
Ta F C2Z.8etir vali? 
8. } 
3 Saric Xi 132 = LO 
10. fin main() { 
i let cell = MyCell::new(&X); 
igs stepl (&cell) ; 
LS a println!(" end value: {}", cell.value); 
14. } 


WSS 213-17 F157 EX T Kžtstepl, KhA% 
rcl, &MyCell<&’' a i32>289. RBA EX T mE Eval, J 
将 其 引用 &val 传 给 了 stpe2 函 数 。 

代码 第 6 一 8 行 定 义 了 step2 函 数 ， 接 收 两 个 类 型 分 列 为 &”b ”i32 和 
&MyCell<&! ai32>WBR. 

代码 第 9 行 定义 了 一 个 静态 变量 X。 

在 main 函 数 中 ， 代 码 第 11 行 使 用 静态 变量 的 引用 &X 声 明了 MyCell 
实例 cell。 代 码 第 12 行 将 &cell 传 入 step1 函 数 中 。 最 后 打印 cell.value 的 
Ba 

代码 清单 13-17 可 以 正常 编译 运 行 。 但 是 这 里 存在 未 定义 行为 的 风 
险 。 注 意 看 代码 第 3 行 ，step1 函 数 中 调用 step2， 并 传 入 了 局 部 变量 val 
的 不 可 变 引 用 &val。 然 后 在 step2 国 数 中 使 用 Set 函数 将 传 入 &val 的 值 设 
置 为 新 值 。 整 个 过 程 都 是 通过 传递 引用 &val 来 实现 的 。 试 想 一 下 : 4 
step2 函 数 执行 完 再 返回 到 step1 会 友 生 什么 ? 当 step1 调 用 执行 完 ， 整 个 
调用 栈 驶 会 航 清 理 ， 局 部 要 量 val 将 不 复 存 在 ， 那 么 &val 也 会 成 为 念 焉 
指针 ， 这 意味 着 cell.value 也 会 成 为 无 法 预期 的 值 。 

这 里 Rust 的 信用 检 和 碍 为 什么 没有 起 作用 呢 。 

原因 在 于 现在 定义 的 MyCell<T 二 是 一 个 协 变 类 型 。Rust 中 大 部 分 


结构 都 是 协 变 ”的 ， 像 这 种 自 定 义 的 结构 体 默 认 也 是 协 变 的 。 代 码 清单 
13-17 中 ， 议 态 变 量 X 的 引用 &X 的 生命 周期 是 ′ static 的 ， 所 以 在 main 
KA h Te Astep1 iH 42 &MyCell< &’ static i32> 类 型 ， 而 step1 函 数 定 义 
rH BER ft & MyCell< &’ a i32> 类 型 。 正 因为 MyCell<T> 是 协 变 ，& 
' static i32 是 &”a i32 的 子 类 型 ， 所 以 &MyCell<=& static 32> 是 
&MyCell<&' ai382> 的 子 类 型 。 按 照 子 类 型 的 规则 ，&MyCell<=& 
static i32> 可 以 代 蔡 &MyCell<&’ ai32> 。 

实际 上 ，Rust 人 允许 这 种 协 变 是 以 “起 记 原始 生命 周期 "为 代价 的 。 所 
以 在 代码 第 3 行 中 ，step1 函 数 第 一 个 参数 &val 的 生命 周期 本 来 应 该 是 ”a 
， 因 为 允许 协 变 而 成 为 ”static ， 所 以 借用 检查 就 正常 通过 了 。 

可 见 ， 如 果 没 有 合理 利用 协 变 ， 将 会 产生 未 定义 行为 的 风险 。 那 么 
如 何 修复 它 呢 ?既然 知道 了 问题 的 原因 ， 人 解决 方案 Wa: 把 
MyCell<T > 的 协 变性 质 改 成 洲 变 或 不 变 束 可 以 。 

1E H PhantomData< T> 

之 前 的 章节 介绍 过 ，PhantompData<T > 是 一 个 零 大 小 类 型 的 标记 
结构 体 ， 也 叫 作 “ 约 影 类 型 ”， 在 需要 指定 一 个 并 不 使 用 的 类 型 时 ， 残 
可 以 使 用 它 。 除 此 之 外 ，PhantomData<T> 还 扮演 以 下 三 种 其 他 角色 


:型 变 。 可 以 产生 协 变 、 逆 变 和 不 变 三 种 情况 。 

标记 拥有 关系 。 和 drop 检 查 有 关 。 

- 目 动 trait 实 现 。 比 如 Send 和 Sync。 

所 以 ， 利 用 PhantomData< 工 > 的 型 变 特性 ， 吏 可 以 修复 代码 请 单 
13-17 的 问题 ， 如 代码 清单 13-18 所 示 。 

代码 清单 13-18: 利用 PhantompData< 工 > 修改 MyCell 一 T> 为 不 变 


Oo OO s1 Gy CI & Co PS FP 


use std::marker::PhantomData; 
struct MyCell<T> { 


value: T, 
mark: PhantomData<fn(T)> , 


impl<T: Copy> MyCell<T> { 


tn new(x: T) =» MyCell<T> 4 
MyCell { value: x , mark: PhantomData} 
} 


Ly fn get(&self) -> T | 
Lis self.value 
Le } 
Les fn set(&self, value: T) { 
14. use Std: yptry 
Las unsafe { 
LD port fwrite liseli. value as “const. as “mut , value); 
Ld Os } 
18, } 
TS jJ 
代码 清单 13-18 重 构 了 MyCell<T> 的 定义 ， 重 点 是 在 之 前 的 基础 
上 增加 了 一 个 类 型 为 PhantompData<fn (T) > 的 mark 字 段 。 


PhantomData<fn (T) > 类 型 属于 抄 变 ， 因 为 fm (T) 指针 类 型 在 Rust 
中 是 耶 变 ， 未 来 的 Rust 厂 本 中 可 能 会 修改 为 不 变 。 


修改 完 MyCell<T> 之 后 再 次 执行 代码 清单 13-17 中 的 代码 ， 编 详 闪 


会 报 以 下 错误 : 


error[E0597]: val does not live long enough 


} 


二 


1 
“““ borrowed value does not live long enough 


printin! (“stepi value: {}", x _.¢cl.value) ; 


- borrowed value only lives until here 


看 得 出 来 ，Rust 售 用 检查 开始 正常 工作 ， 代 但 变 得 更 加 安全 。 


PAR, WARS ANE AIN 

以 下 罗列 了 Rust 中 几 个 重要 的 型 变 关 型 : 

&! aTfE’ afITE wy, MPN *const THe he. 

&' amutT fe’ a beeps, (EET LENS. 

-Fn (T) ->U ET E48, EU 上 是 协 变 。 

-Box<T> 、Vec< 工 > ， 以 及 其 他 集合 对 于 它们 包含 的 类 型 来 说 
都 是 协 变 。 

- UnsafeCell<T>. Cell<T>. RefCell<T>. Mutex<T>, WR 
其 他 内 部 可 变 关 型 在 T 上 者 是 不 变 ， 对 应 的 smut 工 也 是 不 变 。 

EEUW, &mut&’ static str 和 &mut& a sr 不 存在 子 类 型 关系 ， 所 
以 它们 是 不 变 。 如 末 人 允许 它们 协 变 ， 将 会 有 产生 未 定义 行为 的 可 能 ， 正 
如 代码 清单 13-16 展示 的 那样 。 所 以 ， UnsafeCell< 工 > 等 内 部 可 变性 
(包括 可 变 原生 指针 *mut T) 都 是 不 变 。 

对 结构 体 来 说 ， 如 有 末 包 售 的 字段 全 部 是 协 变 ， 则 结构 体 是 协 变 ， 合 
WW AAAS. AOL, XtPhantomdata<T> 类 型 来 说 ， 则 有 以 下 规则 : 

. PhantomDatax<T>, ETE. 

- PhantomDatax<&’ aT>, Æ’ a 和 T 上 是 协 变 。 

- PhantomData<&’ amut T>, 76’ a 上 是 协 变 ， 在 T 上 是 不 变 。 

- PhantomData<*const T>, fET EG pas. 

- PhantomData<*mut T>, 7ET L424. 

- PhantomData<fn (T) > 之， 在 工 上 是 逆 变 ， 如 果 以 后 修改 语法 ， 会 
成 为 不 变 。 

- PhantomData<fn O ->T>， 在 T 上 是 协 变 。 

- PhantomData<fn (T) ->T>， 在 T 上 是 不 变 。 

- PhantomData<Cell<&’ a O >>, Æ' ake HS. 

Rust 中 仅 存 在 函数 指针 名 CT) = AER 情况 ， 如 代码 清单 13-19 所 
ZIN o 

代码 清单 13-19: fn CT) Kae Gl 


trait A f 
ifn fooltselt, sx Ss" etatie sir): 
} 
SLIDGL B; 
imo. A fer B { 
Fn fool&selrt, st @etr) { 


Oo Ws OO eS G& Hw F 


prineri "Lar y Bs 
} 
« J 
LO tengo. B4 
Iia Ti TOOGA (esel; 8: ‘eratio Str) 
Ieg BEIT I i82)"; Bju 
l3., } 
14. } 
Loe LM tein) q 
ló Be TOG ("hel lia”) 3 
i a /j let & = "hello" to string L)? 
LB. // B.f002 (&s) 
lee d 


代码 清单 13-19 中 ， 第 1 一 3 行 定义 了 trait A. trait Ffoork Ae 
名 ， 接 收 一 个 & static str 类 型 的 参数 。 

代码 第 4 一 9 行 定 义 了 结构 体 B， 并 为 其 实现 A。 注 意 ， 此 时 foo 函 数 
的 签名 已 经 改变 为 接收 一 个 &str 类 型 的 参数 。 

代码 第 10 一 14 行 为 结构 体 B 单 独 实现 另外 一 个 函数 foo2， 接 收 类 型 
为 & static str 的 参数 。 

在 代码 第 15 一 19 行 的 main 函 数 中 ， 直 接 调 用 结构 体 实 例 B 的 foo 方 
法 ， 传 入 一 个 字符 串 字 耐量 ， 可 以 正常 编译 运行 。 注 意 ， 字 从 串 字面 量 
JJ&' static str 类 型 。 代 码 第 17、18 行 编译 会 出 错 ， 所 以 将 其 注释 。 

从 该 示例 中 可 以 得 出 以 下 结论 : 

-fn CT) 在 实现 trait 方 法 时 ， 是 揽 变 。 因 为 &” static str<: & a 
str， 而 现在 人 C&’ a str) WO Ai zim (&’ static str) 的 情况 ， 所 
以 得 出 fn (&’ a str) <: fn (&’ static str) , We SPRAY YTA 


型 天 系 。 
普通 的 函数 调用 ， 参 数 是 不 变 ”。 当 参数 需要 && static str 类 型 
时 ， 不 能 用 &str 代 奉 它 。 但 是 函数 的 返回 值 是 协 变 ， 当 人 返回 值 是 &str 的 
时 候 ， 可 以 返回 &static str 类 型 的 值 作为 替代 。 
代码 清单 13-20 是 男 一 个 逆 变 的 示例 。 
Wiis 4413-20: 33—-“Mn CT EER 


i. In Lea(inouts SEEI 4 

Bis De 

EP } 

a. fn. Mat Ent&"* Static str); vi €'Static Str) 4 
a LE) (V); 

Si. } 

Te fn main() { 

Si lët vy 2 &'Static str = “hello”: 

9 . bar (hoo, Vj 

LDe J 


Reais 13-2014, Ebr WEB, SBRNin (&’ static str) 
KA, Emaint, RIE 9 行将 函数 指针 foo 传 给 了 bar 函数 ， 代 
伺 正 党 编 详 运行 。 函 数 指 针 foo 的 类 型 为 fn (&str) ， 所 以 满足 
fn (&str) <: fn (&’ staticstr) ， 此 处 为 池 变 。 

在 不 久 的 将 来 ，Rust 官 方 有 可 能 取消 这 变 。 

总 之 ， 了 解 型 变 对 写 Unsafe 代 人 码 很 有 帮助 。 当 协 变 不 会 引起 未 定义 
ATARI (ee, FY LARS ae, Fa Ua PRUE TARY AB BE TAR 。 


13.2.3 未 绑 定 生命 周期 


Unsafe 代 但 很 容易 产生 未 绑 定 生命 周期 (Unbound Lifetime) ， 即 
可 以 被 随意 推 腺 的 生命 周期 。 主 要 注意 下 面 两 种 情况 : 

` 当 从 原生 指针 得 到 引用 时 ， 比 如 &*raw_ptr 。 

- 使 用 std: : mem: : transmute 方法 但 没有 显 式 给 定 生命 周期 ， 比 
如 transmute: : <&T, &U> (foo) . 

iis 13-21 aN ST MIRAE TET FS BS] AS To 


代码 清单 13-21: 从 原生 指针 得 到 引用 


于 
ie unsafe { 

Si return &*input 

4. } 

ST } 

6. øn main() { 

Ta let x; 

Sis { 

as let y = 42; 

10., x = foo(&y); 

Lia } 

Ies Printin! | WelLLOy ++ sg he 


Lae 4 

代码 清单 13-21 中 定义 了 函数 foo， 其 参数 input 为 原生 指针 *const 
u32 类 型 ， 然 后 通过 解 引 用 原生 指针 和 引用 符号 将 其 转 为 引用 ， 其 
中 “&*input ”相当 于 “& (*input) ”。 

在 main 函 数 中 ， 人 代码 第 8 一 11 行 使 用 了 作用 域 块 ， 其 中 调用 了 函数 
foo， 并 将 信用 &y 传 入 。 在 第 12 行 打印 x 的 仁 。 如 采 按 Safe Rust 的 规则 ， 
由 于 foo 隙 数 返回 的 是 一 个 引用 ， 此 处 是 对 y 的 引用 ， 但 是 在 离开 作用 域 
La, YARR, Probst See o Rust ikasiz 
SHIR ARE oR. HKP E, AETA AE mE ANAL 
foo K AUE T — Ph ARS E E m PA fe» Ar atk T Rusthy fe H 
REX 。 

在 Debug 模 式 下 编译 运行 会 输出 正常 的 结果 “hello: 42”， 但 是 在 
Release 模 式 下 编译 运行 ， 则 会 输出 超出 预期 的 结果 ， 比 如 “hello: 
1151157120”， 产 生 了 未 定义 行为 。 

代码 清 单 13-22 展 示 了 男 外 一 种 产生 未 绑 定 生命 周期 的 情形 。 

代 侣 清单 13-22: (AA transmute ph 274 21) 5| A 


1. use std: :mem::transmute; 

4. in main() { 

Fa let gi 6192} 

4. { 

二 let a = 12; 

-M let ptr = &a as *const 132; 

Ta x = unsafe { transmute::<*const 132, &132>(ptr) H 
Bis } 

9. PELNEIAL ("hello Ti Ji 

LQ. 4} 


代码 清单 13-22 中 ， 使 用 了 std: : mem: : transmute<T, U> Ki 
数 ， 该 函数 可 以 将 类 型 T 转 为 类 型 U。 这 是 一 个 unsafe 函 数 ， 使 用 不 当 将 
会 产生 未 定义 行为 。 

在 main 函 数 中 ， 将 原生 指针 ptr 通 过 transmnute 函 数 转 为 &i32 类 型 ， 此 
时 会 产生 未 绑 定 生命 周期 。 在 离开 作用 式 块 之 后 ，x 将 会 产生 合算 指 
针 。 跟 代码 清单 13-21 类 似 ， 在 Release 模 式 下 编译 将 会 产生 无 法 预期 的 
值 ， 比 如 “hello: -697728128”. 

所 以 ， 从 原生 指针 得 到 引用 的 时 候 ， 需 要 避免 以 上 两 种 情况 ， 从 而 
避免 未 定义 行为 的 发 生 。 


13.2.4 Drop 检 得 


Drop Æ (dropck) 是 借用 检查 右 的 附属 程序 ， 它 是 为 了 让 析 构 也 
数 可 以 更 安全 合理 地 被 调用 而 存在 。 

一 般 来 说 ， 析 构 函 数 的 调用 顺序 与 变量 的 声明 顺序 相反 。 也 就 是 
襄 ， 如 果 和 存在 明确 的 声明 顺序 ， 则 编译 人 颖 可 以 推 师 析 构 函数 的 调用 顺 
序 。 但 是 对 于 同时 声明 的 情况 ， 比 如 声明 一 个 元 组 时 ， 其 内 部 元 系 的 生 
命 周期 是 相同 的 ， 编 译 豆 无 法 推 亲 到 辰 该 移 调 用 谁 的 析 构 函数 。 当 出 现 
这 种 情况 的 时 候 ， 束 容易 产生 芒 王 指针。 

在 Safe Rust 中 由 dropck 引 起 的 问题 

在 Safe Rust 中 出 现 这 种 情况 时 ，Rust 编 译 器 会 报错 ， 如 代码 清单 13- 
23 所 示 。 


代码 清单 13-23: 声明 元 组 变量 测试 dropck 


0O ~J O oP WN FF 


O 


PPP RP RP RPP RP PB 
OO IHN OB WNHOFeH oO. 


w WW BD PY ND NN NY NY v WN ND 
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use std::fmt; 

#[derive (Copy, Clone, Debug) ] 
enum State { InValid, Valid } 
# [derive (Debug) ] 


Struct. Helle<T: Emt::Debuo>(é&' static str, 


impl<T: fmt::Debug> Hello<T> 1 
fn new(name: &'static str, t: T) 
Hello(name, t, State::Valid) 


} 


= Self 4 


impl<T: fmt::Debug> Drop for Hello<T> { 


fn drop(é&mut self) 1 


printin! ("drop Hello({}, {32}, 


self.0O, 
self.l, 
self.2); 
self.2 = State::InValid; 


} 
struct WrapBox<T> { 
vs: Box<I>, 
} 
impl<T> WrapBox<T> { 
fn new(t: T) -> Self { 
WrapBox { v: Box::new(t) } 


} 
Ca LL i 
// let x; let y; 
let (x, y)? 
x = Hello::new("x", 13); 


y = WrapBox: :new(Hello::new("y", 


fn main() { 
CLL? 


&X)); 


(225)", 


代码 清单 13-23 中 第 2、3 行 定义 了 枚 举 类 型 State ， 目 的 是 为 了 在 析 
构 函 数 中 输出 变量 的 状态 。 

代码 第 4 一 19 行 定义 了 一 个 泛 型 结构 体 Hello<T > ” ， 并 为 其 实现 
new 方 法 和 析 构 冰 数 。 访 析 构 函数 会 在 Hello 被 释放 的 时 候 调 用 ， 并 和 输出 
预期 的 结果 。 

代码 第 20~27 行 定 义 了 新 的 结构 体 WrapBox<T> ， 是 对 Box< 
T> 的 包装 ， 并 为 WrapBox<T> 实 现 了 new 方 法 。 

代码 第 28~~33 行 实现 了 函数 {1。 在 第 30 行 通过 元 组 形式 声明 了 变 
量 ， 这 是 故意 为 之 ， 目 的 是 让 编 详 苍 无 法 推 其 xX 和 y 的 析 构 顺序 。 注 意 ， 
在 代码 第 32 行 中 ，WrapBox<T> 的 实例 包含 了 x 的 引用 。 

所 以 整个 代码 编 详 执行 以 后 ， 会 搜 出 代码 清单 13-24 所 示 的 错误 。 

代码 清单 13-24: 代码 清单 13-23 编 译 产 生 的 错误 信息 
error[E0597]: x does not live long enough 
“<2 sre/main, PSs 
| y = WrapBox::new(Hello::new("y", &x)); 
| “ borrowed value does not live 


long enough 
| J 
| - X dropped here while still borroweds 
= note: values in a scope are dropped in the opposite order they are created 
AS is FA 13-24 0 ANAS x FEN TE ANS A. KEE Hs PE a TIA 
HE TEE TX Aly AT RJA SPB) © WR XT Py BEI, WM Sex mh ROW 
FEFREL, XÆ Safe Rust 不 允许 出 现 的 事情 。 
解决 这 个 问题 也 很 简单 ， 只 需要 修改 x 和 y 的 声明 顺序 即 可 ， 如 代 但 
清单 13-23 中 第 29 行 所 示 。 只 要 按 该 行 指定 的 顺序 声明 变量 x 和 y， 人 整个 
代码 就 可 以 正常 编译 运行 ， 因 为 此 时 编译 器 可 以 准确 推断 x 和 y 的 析 构 顺 
序 。 正 第 输出 的 结果 如 代码 消 蛙 13-25 所 示 。 
代码 清单 13-25: 代码 清单 13-23 经 过 修改 后 正常 输出 结 
drop Helloty, Hello("x", 13, Valid), Valid) 
atom Helios, 13; Walid) 


代码 清 日 13-25 消 楚 地 显示 出 ， 先 调用 y 的 析 构 函数 ， 然 后 调用 x 的 


析 构 函数 ， 并 且 两 个 变量 在 调用 析 构 函数 的 时 候 都 是 Valid 状 在， 表示 
MZE, FR BME 

在 Safe Rust, WrapBox<T> #38 [Box<T>, 2 #kRust4qit Ze 
识别 为 WrapBox<T> 通 过 Box<T> 间 接 拥 有 T。 虽 然 wrapBox<T>> 没 
有 显 式 实现 Drop， 但 因为 这 一 层 拥 有 关系 ，Rust 也 会 在 WrapBox< 工 > 
被 释放 之 后 逐个 自动 地 调用 T 上 的 析 构 函数 。 

并 [may_dangle] 属 性 与 dropck 

接 下 来 尝试 在 修正 后 的 代码 清单 13-23 的 基础 上 新 增 一 个 自 定 义 的 
结构 体 MyBox 二 TT ”， 访 结构 体 利 用 原生 指针 来 丛 代 Box 二 TT。 这 束 
南 要 手动 在 扒 上 分 配 内 存 ， 所 以 需要 在 Nightly Rust 版 本 之 下 使 用 # ! 
[feature (allocator_api] 特性 ， 如 代码 清单 13-26 所 示 。 

代码 清单 13-26: 使 用 原生 指针 的 结构 体 


| 

em use std::alloc::{GlobalAlloc, System, Layout}; 
dn USE Stde: pcr 

4. use std::mem; 

5. // 此 处 省 略 State, Hello, impl Hello 等 定义 

6s struct MyBox<l> 1 

Ta ve zoons t T 

G= }ł 

9. gampl<T> MyBox<T> 1 

LU fn new(t: T) => Self { 

Lle unsafe { 

Le let p = System.alloc (Layout: :array::<T>(1).unwrap()); 
i let p =p as *mut T; 

Lf por: twrite tp, ©]? 

Los MyBox { v: p } 


| 
ON 
一 一 


x Impl<T> Drop for MyBox<T> { 


fn drop(é&mut self) 1 
unsafe { 
leg p = sell.vy as “mut ; 
System.dealloc (p, 
Layout: sarray::<T>(mem::align of::<T>()).unwrap()); 


let. (el, yi); 
Xl = Hello::new("xl", 13); 
yl = MyBox::new(Hello::new("yl", &xl)); 


lee, (22, YZ) 
x2 = Hello::new("x2", 13); 
y2 = MyBox::new(Hello::new("y2", &x2)); 


D d 


. fn main() { 


H ELI 
ANE 


- i 


代码 清早 13-26 中 为 了 展示 而 省 略 了 代 公 清单 13-23 中 关于 State、 


Hello， 以 及 为 Hello 实 现 new 和 drop 的 代码 ， 但 实际 上 它们 还 会 被 用 到 。 


std: 


RAS. 247 AA +H! [feature Callocator_api) ] 特 性 ， 以 及 引入 
: alloc 模 块 中 的 GlobalAlloc、System 和 Layout 都 是 为 了 在 堆 中 分 配 


内 存 。 注 意 ， 本 章 使 用 的 feature 在 未 来 的 Rust ”Nightly 版 本 中 会 有 所 变 


化 ， 


请 以 本 书 的 随 书 源码 为 准 。 


代码 第 3、4 行 引入 std: : ptr 和 std: : mem 模块 ， 要 用 到 其 中 的 
PR BY 

代码 第 6 一 8 行 定义 了 新 的 结构 体 MyBox<T > 之， 其 字段 v 是 *const T 
类 型 的 原生 指针 。 

代码 第 9 一 18 行 为 MyBox 二 TT 二 实现 了 new 方法 ， 在 new 方 法 中 使 
用 System.alloc ”方法 分 配 堆 内 存 ， 其 参数 Layout: : array: : <T> 
(1) HET 类 型 来 指定 布局 。 在 分 配 好 内 存 之 后 ， 再 通过 得 到 的 指针 
写 入 数据 。 了 最 后 将 指针 存 入 MyBox< 工 > 结构 体 实 例 中 。 

代码 第 19 一 27 行 为 MyBox<TI > 实现 Drop ， 在 drop 方 法 中 使 用 
ptr: : read 谈 取 指 针 v 对 应 的 数据 T， 然 后 通过 System.dealloc 方法 将 T 
的 内 存 释 放 ， 其 参数 Layout: : array: : <T> (mem: : 
align_of: : <T> O ) 表示 投工 的 内 存 对 章 方式 获取 相应 的 内 存 布 
局 有 

代码 第 28 一 39 行 实现 了 和 函数。 最 后 在 main 函 数 中 调用 亿 函 数 。 注 
mi, fl PaO RIE. 

WSs 13-264 E ae Fh OO (Ss 13-27 PAN EN Ft TK o 

代码 清单 13-27: 代码 清单 13-26 纺 详 错误 信息 


error[E0597]: `x1° does not live long enough 

=c Sro/main. rss 

| yl = MyBox::new(Hello::new("yl", &x1)); 

| ^^ borrowed value does not live 
long enough 

| 

| - XlL dropped here while still borrowed 

= note: values in a scope are dropped in the opposite order they are created 
error[E0597]: x2 does not live long enough 

-=> şro/main. rss 

| y2 = MyBox::new(Hello::new("y2", &x2)); 

| ^^ borrowed value does not live long 
enough 

| 

| - `x2` dropped here while still borrowed 


= note: values in a scope are dropped in the opposite order they are created 

ARIS 13-270 EERIK H ze I Ag i Ar AIA TE Wr AE E BY AT S 
而 引起 的 。 编 译 器 担心 开发 者 会 在 drop 方法 中 调用 工 的 数据 ， 避 人 免 出 
现 悬 垂 指针 。 但 现在 代码 清单 13-26 中 MyBox<T> 的 drop 方 法 是 开发 
人 员 和 上 自己 实现 的 ， 并 且 没 有 使 用 到 T 的 数据 ， 不 会 出 现 巧 垂 指 针 。 那 么 
有 什么 办 法 让 代码 通过 编译 呢 ? 答案 征 使 用 # [may_dangle] 属性 。 

利用 #[may_danglel 属性 来 修改 drop 方 法 ， 如 代码 清单 13-28 所 
人 小。 

代码 清单 13-28: 修改 drop 方 法 


1. #![feature (allocator api, dropck eyepatch) ] 

2. // 其 他 同上 | 

3. unsafe impl<#[may dangle] T> Drop for MyBox<T> 1 
4. fn drop(&mut self) { 

as unsafe { 

Cis printin! ("mybox drop” } ; 

fe ley p= geliy as MS f 

8, System.dealloc(p, 

Di hayoult i array: *<T> (em: Salign, cfs i <i> ()). Unwrap); 
10. } 

E } 

Loe d 


RAS 13-28 81775) A S #! [feature (allocator_api, 
dropck_eyepatch) ] 特 性 。 

代码 第 3 行 变 为 "unsafe impl< +[may_dangle] T> Drop for 
MyBox<T> ”。 其 中 , “<#[may_dangle] T> ”代表 在 drop 方 法 实现 
中 ， 将 不 会 用 到 T， 售 则 可 能 会 出 现 共 牌 指 针 Cmany_dangleiii may 
dangle pointer 的 意思 ) 。 因 为 这 是 需要 开 有 人员 去 体 证 的 ， 所 以 要 用 
unsafe 关 键 字 来 标记 impl。 

经 过 这 样 的 修改 之 后 ， 代 码 即 可 正 第 编 诺 运 行 。 但 是 这 样 瓯 可 以 了 
四 ? 答案 是 否定 的 。 如 果 在 drop 方 法 中 使 用 了 T， 则 会 友 生 巧 延 指针， 
如 代码 清单 13-29 所 示 。 

代码 清单 13-29: 修改 drop 方 法 和 人 2 函数 

1. // 其 他 代码 同上 

2. unsafe impl<#[may dangle] T> Drop for MyBox<T> { 


3 fn drop(&mut self) { 

4 unsafe { 

5 potr::read(self.v); // 此 处 新 增 

0. lel. DP = Séeli.¥ a8 “Mic } 

7 system.dealloc(p, 

8 Layouts rarray: r<> {mems valign of s:<T>()).unwrap() ); 
9 


14. let (xl; yi); 
hel x1 = Hello::new("x1", 13); 
Ls yl = MyBox::new(Hello::new("yl", &x1)); 


19. let (y2, x2); // RAAS 
AY a x2 = Hello: enew( "mz", 13) 3 
Aly y2 = MyBox::new(Hello::new("y2", &x2)); 


Zou 

代码 清单 13-29 修 改 了 两 处 ， 分 别 是 代码 第 5 行 和 第 19 行 。 

代码 第 5 行 新 增 了 ptr: : read 函 数 谈 取 工 的 内 容 。 此 行 代 码 才 示 
MyBox<T> 的 drop 方 法 中 用 到 了 T。 

代 人 码 第 19 行 故意 将 之 前 x2 和 y2 的 声明 顺序 换 了 了 位置。 于 是 代码 编 译 
之 后 ， 输 出 结果 如 代码 清单 13-30 有 所 示 。 

代码 清单 13-30: 打印 结果 

drop Hello(yl, Hello("xil", 13, Valid), Valad) 

Kl, oo, Vala 
MZ; Aar Valid) 
drop Helletyz,; Hello("x2z", 13, Invalid); Valig) 


从 代码 清单 13-30 中 可 以 看 出 ，x1l 和 yl 是 正常 的 释放 顺序 ， 但 是 x2 


drop Hello 


( 
( 
drop Hellol 
( 


和 和 y2 束 出 现 了 问题 。 最 后 一 行 显示 内 层 Hello 实 例 的 状态 是 InValid , it 
明 此 处 产生 了 巧 牌 指针 ， 因 为 访问 到 已 经 执行 了 析 构 函数 的 工 的 值 。 

这 样 的 结果 有 违 Rust 的 安全 理念 ， 有 什么 办 法 可 以 让 Rust 执 行 更 严 
格 的 drop 检 查 呢 ? 

使 用 PhantompData< 工 > 得 到 更 严格 的 drop 检 碍 

因为 MyBox<T> 用 了 原生 指针 ， 而 原生 指针 没有 所 有 权 语 义 。 也 
束 古 说 ，Rust 编 译 占 不 会 认为 MyBox 二 TIT 二 拥有 TIT。 这 束 意 味 着 ， 在 进行 
drop 检 否 时 ， 不 会 严格 要 求 T 的 生命 周期 必须 长 于 MyBox< 工 > 。 所 以 在 
MyBox<I > 的 drop 方 法 中 使 用 I 的 时 候 ， 编 译 器 完全 忽视 了 TI 很 可 能 被 
提前 释放 的 可 能 。 前 面 提 到 PhantomData<T>> 的 功能 之 一 就 是 标记 拥有 
关系 ， 正 好 可 以 解决 这 个 问题 。 

在 代码 清单 13-29 的 基础 上 ， 再 重新 创建 MyBox2 天 工 > 结 构 体 ， 如 
代码 清单 13-31 所 示 。 代 但 清单 13-31: 3 MyBox2 <T> 


1. // 其余 代码 同上 

2. use std::marker::PhantomData; 

ds Struct MyBoxz<T> 1 

4, vs *=Conet T 

is _pd: PhantomData<T>, 

GO.  f 

Te ampl<T> MyBox2<T> { 

8. fn new(t: T) -> Self { 

Aa unsafe{ 

10. let p = System.alloc (Layout: :array::<T>(1).unwrap()); 
se a let p = p as “mut T; 

Iž: ptr: write {BB; ty 

dike e MyBORZ 4 Vi Pe pat Perault <defaulti) | 
14. } 

LS } 

LBs: J 

17. unsafe impl<#[may dangle] T> Drop for MyBox2<T> { 
1g. fn drop(&mut self) { 

Lo. unsafe { 

ZU. ptr::read(self.v); 

bl; let. p = geliy as můr } 

La System.dealloc(p, 

Ld 。 Layouts (array: e<T> (mem: calign. ofs:<i>()).unwrap()); 
24. } 

20% } 

Epe } 

fiw EA FSC) f 

28. //f let (vr x)? 

29, fj? let (£r y)? 

30. let x; let y; 

eh a x = Hellors:new("x", 13); 


Se x y = MyBox2::new(Hello::new("y", &x)); 
S38 2 

34. £m. Main) 4 

35. ff ELU} 

36. ff Eat) 

Car EFASI 


a8. | 


代码 清单 13-31 F, ert  MyBox2<T>, 55 MyBox<T>/ME— FY 
不 同 就 是 多 了 一 个 PhantomData<T> 之 字段 pd， 该 字段 的 作用 就 是 告诉 
Rust 编 译 器 一 个 事实 : MyBox2<T>iAAT o IMER, EAT 
MyBox2<T> HITA PALIN, DEARA EAA #[may_dangle] 属性 ， 
HAS Wh 2-22 RT AYE mA HS -MyBox2<T>. 

RAGE 17 ~ 2647 AMyBox2<T> KI J Drop, F HEH T # 
[may_dangle] 属 性 。 

代码 第 27~~33 行 定义 了 函数 {人 3。 在 该 函数 中 必须 强制 指定 x 和 y 的 
声明 顺序 ， 以 便 编译 器 推断 变量 的 drop 顺序 。 对 于 代码 第 28 行 和 第 
29 行 所 注释 的 两 种 写 法 ， 编 译 天 无 法 推 产 drop 顺序 ， 不 予 通过 编译 。 

所 以 在 处 理 drop 检查 的 时 候 ， 可 以 通过 以 下 两 个 维度 来 处 理 代码 
避免 出 现 未 定义 行为 : 

:并 [may_dangle] 属性 ， 访 属性 使 用 unsafe 对 impl Drop 进 行 标 记 ， 以 
此 来 警示 开发 者 不 要 在 析 构 函数 中 使 用 其 拥有 的 数据 。 

- PhantomData<T> ， 用 于 标记 复合 类 型 拥有 其 包含 的 数据 。 这 
辣 味 看 ， 该 复合 类 型 将 会 性 循 严 格 的 drop 检 查 ， 包 含 数 据 的 生命 周期 必 
须 长 于 复合 类 型 的 生命 周期 。 

来 目标 准 库 中 的 用 法 

在 Rust 标 准 库 中 经 党 结合 两 者 使 用 。 代 码 清 蛙 13-32 展 示 I Vec<T 
> F#llLinkedList<T > AFAR A. 

代码 清单 13-32: 标准 库 中 Vec<T > 和 LinkedList<T 之 相关 实现 


Ls Pub Struct Vee<cT> 4 

Zi buf: RawVec<T>, 

EP len: usize, 

4. } 

5. pub struct RawVec<T, A: Alloc = Global> 1 
Os ptr: Unique<T>, 

Ta Cap: usize, 

B. a: A, 

S f 

LO. pub struct Unigue<T: 7lSized> | 

Lig pointer: NonZero<*const T>; 

12. _marker: PhantomData<T>, 

Laa ] 

14. unsafe impl<#[may dangle] T> Drop for Vec<T> { 
Los fn drop (smut. self) { 

LG. unsafe { 

bay per: drop Iin place (smut. selt[...])¢ 
L8, } 

Les } 

Zh 

21. pub SEPUGEt Linkediast<is | 

Ed is head: Option<NonNull<Node<T>>>, 

Ria tail: Option<NonNull<Node<T>>>, 

24 len: usize, 

25 marker: PhantomData<Box<Node<T>>>, 

265 | 

27. unsafe impl<#[may dangle] T> Drop for LinkedList<T> { 


aS fn drop(é&mut self) { 
while et Sene( ) = Sselr.pop trent pode) {} 


CG GW N 
«ca ko 
y= 


} 
代码 清单 13-32 中 ，Vec<T> 通 过 RawVec<T>> 间 接 拥 有 T， 而 
RawVec<T> 4eUnique<T> HAT. fEUnique<T> HEH 
PhantomData<T> 来 保证 拥有 关系 ， 这 样 drop 检 奏 束 会 严格 要 求 开 发 


者 保证 析 构 顺序 。 

Vec 二 TT 的 析 构 函数 使 用 了 #[may_dangle] 属性， 这 将 警示 编 
该 析 构 函数 的 开发 者 注意 不 要 去 使 用 拥有 的 数据 。 

EJ, LinkedList<T>th{#}4 Y PhantomData<T> #ll # 
[may_dangle] 属 性 达到 与 Vec<T 之 相同 的 目的 。 

使 用 std: : mem: : forgethH ik pre ek Bia H 

Rust F HITARAR A ze A EN, (EEA ERAADA EB Vl FT 
构 函 数 。 比 如 ， 通 过 FFI 和 C 语 言 交 互 ， 在 Rust 中 创建 的 数据 需要 在 C 中 
被 调用 ， 如 果 在 Rust 中 被 释放 ， 则 C 中 调用 的 时 候 会 出 问题 。 所 以 Rust 
提供 了 一 个 函数 std: : mem: : forget 来 处 理 这 种 情况 。 

如 代码 清单 13-33 所 示 。 

代码 清单 13-33: 转移 结构 体 中 字段 所 有 权 示 例 


dt 


dl SEEUCE AL 

že Steve B 

Ss Beruce Foo { 

4. a: A, 

oe BE B 

ix } 

7. impl Foo { 

ome fn take(self) -> (A, B) { 
9. (self.a, self.b) 
LG) y } 

Vie J 


12, Lh. Malia t) 4 } 

代码 清单 13-33 中 定义 了 结构 体 Foo， 其 字段 a 和 b 的 类 型 分 别 是 结构 
体 A 和 也 。 为 Foo 结 构 体 实现 了 take 方 法 ， 访 方法 返回 由 Foo 字 段 值 组 成 的 
(A, B) 类 型 的 元 组 。 

这 里 的 重点 ”是 ，take 方 法 会 将 Foo 结 构 体 字段 a 和 b 的 所 有 权 转 移 。 
这 是 Rust 允 许 的 ， 该 段 代 人 是 可 以 正常 编译 通过 的 。 但 是 ， 如 果 给 Foo 
结构 体 实现 了 Drop ， 情 况 束 会 发 生变 化 ， 如 代码 清单 13-34 所 示 。 

AS 13-34: 为 结构 体 Foo 实 现 Drop 


1. // 其 余 代 码 同 上 

2 impl Drop for Foo { 

iP fn drop(&mut self) { 
4 // 做 一 些 事 

3 } 

6 } 


代码 清早 13-34 中 为 Foo 结 构 体 实现 了 Drop， 再 次 编译 代码 会 出 现代 
码 消 单 13-35 所 示 的 错误 。 

代码 消 里 13-35: 代码 清单 13-34 的 错误 信息 
error [EU0509] : cannot move out of type “Foo , which implements the Drop’ trait 
Bey mol, rss 
| (self.a, self.b) 
| ceee** cannot move out of here 
error [E0509]: cannot move out of type Foo’, which implements the ‘Drop’ trait 
-> BrO/maim, pe 
| (self.a, self.b) 


| ANKAAAKAKAA 


cannot move out of here 

代码 清单 13-35 中 错误 信息 显示 ，Rust 编 译 器 不 允许 移动 Foo 结 构 体 
的 两 个 字段 ， 原 因 是 Foo 结 构 体 实现 了 Drop。 在 Foo 的 析 构 函数 中 ， 有 可 
能 会 用 到 其 字段 ， 所 以 不 能 把 所 有 权 转 移 走 。 

如 果 在 这 种 情况 下 必须 转移 Foo 字 上段 所 有 权 ， 则 可 以 使 用 std: 
mem: : forget 郧 数 。 如 代码 清单 13-36 所 示 。 

代码 清单 13-36: 重新 为 Foo 实 现 take 方 法 


‘i use std: :mem; 

2 // 其 余 代码 同上 

3 impl Foo { 

4 fn take(mut self) -> (A, B) { 

Bis let a = mem::replace ( 

6 &mut self.a, unsafe { mem::uninitialized() } 
7 ) ; 

8 let b = mem::replace ( 

9. &mut self.b, unsafe { mem::uninitialized() } 
i a E 

VEs mem: : forget (self); 

Ls ar i) 

Ls- } 

Wi 


ARAGIA #13-36'F, K Fooi ti take WIE HE or SCH a, AS 
RIE HS ag PEE. ATS AE SPAS AY RIS: mem: : 
uninitialized 和 mem: : forget . 

Ht, mem: : uninitialized 古 一 个 unsafe 疯 数 ， 在 take 方 法 中 ， 将 a 
和 b 的 值 都 通过 该 冰 数 修改 为 “ 伪 疙 的 初始 化 伸 ”， 用 于 跳 过 Rust 的 内 
FEB YR he 。 但 这 样 做 是 危险 的 ， 如 采 此 时 对 a 和 b 进 行 谈 取 或 写 
和 入， 都 会 引起 未 定义 行为 。 该 函数 一 般 用 于 FFI 和 CC 语言 交互 。 

AJh, mem: : forget 岗 数 会 将 当前 的 Foo 实 例 “ 筷 挥 *"”， 这 样 Foo 实 
例 束 不 会 被 释放 ， 析 构图 数 也 不 会 被 调用 。 但 forget 困 数 不 是 unsafe 郴 
数 ， 因 为 使 用 该 函数 引起 的 后 果 是 内 存 汇 涯 ”， 对 Rust 来 襄 ， 属 于 安全 
won 。 而 对 开发 者 来 襄 ， 需 要 在 适合 的 地 方 手 动 调用 drop 方 法 来 运行 
析 构 函数 。 

在 析 构 函数 中 手动 指定 析 构 顺序 

在 std: : mem 模 块 中 还 提供 了 为 外 一 个 联合 体 ManuallyDrop， 通 过 
它 可 以 实现 在 析 构 函数 中 手动 指定 析 构 顺序 。 

如 代码 清单 13-37 所 示 。 

代码 清单 13-37: ManuallyDrop 使 用 示例 


use std::mem: :ManuallyDrop; 
struct Feach; 
struct Banana; 
struct Melon; 
SEFUGE FRULEBGE { 
peach: ManuallyDrop<Peach>, 
melon: Melon, 
banana: ManuallyDrop<Banana>, 
} 
G ampl Drop for FruatBox 1 
1 fn drop(&mut self) { 


= Feo wast GF Oo => Gs NH FE 


i2. unsafe { 

de ManuallyDrop::drop(&mut self.peach) ; 
14. ManuallyDrop::drop(é&mut self.banana) ; 
il } 

LS. } 

Lee d 


18. fn main() {} 

代码 清单 13-37 H, FruitBox 结构 体 中 ，peach 和 banana 两 个 字段 
的 类 型 均 为 ManuallyDrop<T> 类 型 。 所 以 在 其 析 构 函数 中 ， 通 过 
ManuallyDrop: : drop 水 数 显 式 指定 peach 和 banana 的 析 构 顺 友 。 

那么 ，ManuallyDrop 是 如 何 做 到 这 一 点 的 ?Rust 代 码 中 术 构 函数 不 
是 目 动 调用 的 吗 ? 它 有 什么 神奇 乙 处 呢 ? 代码 清单 13-38 展 示 了 
Manually Drop HJ IFAH - 

代码 清单 13-38: ManuallyDrop < T> KABAR il 


#[allow(unions with drop fields) ] 
# [derive (Copy) ] 
pub union ManuallyDrop<T>{ value: T } 
impl<T> ManuallyDrop<T> { 
pub const fn new(value: T) -> ManuallyDrop<T> { 
ManuallyDrop { value: value } 
} 
pub unsafe fn drop(slot: &mut ManuallyDrop<T>) { 


O 00 =l © OC] & GW NW F 


pEr: drop an place (4mut slot .valne) 


代码 清单 13-38 展 示 了 ManuallyDrop< 工 > 的 主要 实现 。 
ManuallyDrop 雪 工 > 是 一 个 联合 体 ，Rust 不 会 为 联合 体 目 动 实现 Drop. 
因为 联合 体 是 所 有 的 字段 共用 内 存 ， 不 能 随便 被 析 构 ， 合 则 会 引起 未 
定义 行为 。 

所 以 ， 只 要 通过 ManuallyDrop: : new 方法 创建 一 个 ManuallyDrop 
<T > 实例 ， 就 只 能 通过 ManuallyDrop: : drop 函 数 手动 调用 析 构 函 
数 。 实 际 上 ，std: : mem: : forget< 工 > 函数 的 实现 就 是 用 了 
ManuallyDrop: : new 方 法 ， 如 代码 清单 13-39 所 示 。 

代码 清单 13-39: forget <T> ŽURI 

Le WES 下 BeOESGEGERTS (Es T 4 


a ManuallyDrop: :new(t)  ; 
3a d 


代码 清单 13-39 展 示 了 std: : mem: : forget<T > 函数 的 源码 实 
现 ， 看 上 去 十 分 简单 。 


13.2.5 NonNull< T> #§#t 


NonNull<T 了 二 指 针 实 际 上 是 一 种 特殊 的 *mut T 原生 指针 ， 它 的 特 
丈 之 处 有 两 点 : 协 变 (covariant) 和 非 零 (non-zero) 。 

NonNull<T> & ÆW. ANUnsafe Rust 默 认 的 原生 指针 ， 而 非 *const 
T #Al*mut T 。 因 为 *const T 和 *mut T 基本 上 是 等 价 的 ， 它 们 可 以 相互 
转换 。 但 不 能 从 *const 工 直接 得 到 &mut T- 


在 NonNull 被 引入 之 前 ，Unsafe 代码 中 最 常见 的 模式 就 是 使 用 
*const 工 ， 结 合 PhantomData< 工 之 得 到 协 变 结构 体 ， 并 且 在 需要 的 时 候 
会 将 *constT 转换 为 smutT。 使 用 NonNull< 工 > 就 不 需要 进行 转换 了 ， 
因为 它 本 号 就 等 价 于 一 个 协 变 版 本 的 *mut T ， 但 是 还 需要 PhantomData 
<T > 在 必要 时 提供 不 变 或 加 强 drop 检 和 奏 。 

NonNull<T> (J A Ji 

代码 清单 13-40 展 示 了 NonNull<T> 的 源码 。 

代码 清单 13-40: NonNull<T> 和 NonZero 源 码 示意 
pub struct NonNull<T: ?Sized> { 


pointer: NonZero<*const T>, 


} 

#[lang = "non zero"] 

# [derive (Copy, Clone, Eq, PartialEg, Ord, PartialOrd, Debug, Hash) ] 
pub struct NonZero<T: Zeroable>(pub(crate) T); 


代码 清单 13-40 展 示 了 NonNull<T > 实际 上 是 对 NonZero<*const T 
> 的 包装。 因为 *const TT 是 协 变 类 型 ， 所 以 NonZero 二 *const T> 7} 
变 ，NonNul<T> 也 是 协 变 。NonNul<T> 和 代码 清单 13-32 中 展示 的 
Unique<T> JE AHA, AE A ESNonNull<T>/7> y —~PhantomData 
<T 之 类 型 的 字段 。 所 以 NonNull<T> 和 T 没 有 严格 的 拥有 关系 。 

代码 第 4 一 6 行 展 示 了 NonZero<T> 的 定义 ， 它 属于 Rust 核心 库 
(core) 的 类 型 。 其 定义 中 的 Zeroable 限定 用 于 判断 TI 是 否 为 零 (Null 或 
FA) o NonZero<T>WVFH Ste : WE MAES ， 并 且 加 上 了 
# [lang= " non_zero " ] RIELE RAI M, JEER o 

NonNull<T> th eth f—-#42 7, TVA Ree We eA JR 
生 指 针 ， 如 代码 清单 13-41 所 示 。 

代码 清单 13-41: NonNull 二 T 二 内 置 方法 示例 


ey 1 & RY BD Fr 


1 use Star pert: (null, NonNull fj 

2 fn main() { 

3 let ptr : NonNull<i32> = NonNull::dangling(); 

4 . 的 和 

Dn let mut v = 42; 

6 let ptr : Option<NonNull<i32>> = NonNull::new(émut v); 
fi 

8 

9 


println! ("{:?}", ptr); // Some (0x7£££73406a78) 
Bein Ln ("isi «, Bee weep () say ptr) IF /7 ORTtEris40ea7s 
| prineläl("{]", Wngafetptr.utwrap().as mae) /7 42 

LO. let mut v = 42; 

j 1 let ptr = NonNull::from(&mut v); 

ie Prise lale {igre , OLEIS A ORITTLLT INNOG T 

L5- het SOLL pe “GONSE 232 = null); 

14. let ptr = NonNull:snew(null p as “mut 132) ; 

Ti, ørinblal{" <2)" opel: Jy Nene 

Loe. J 


代码 清单 13-41 中 第 3、4 行 使 用 了 NonNull: : dangling 函数 来 创建 
一 个 新 的 巧 王 NonNull 指 针 ， 但 它 的 内 存 是 对 齐 的 。 它 在 一 些 场景 里 用 
于 类 型 初始 化 ， 比 如 使 用 Vec: : new 创 建 一 个 空 的 动态 数组 ， 需 要 初 
始 化 一 个 指针 。 它 是 安全 的 。 

代码 第 5 一 7 行 可 以 通过 NonNull，，: new piace OANA RA TB 
针 生 成 Option<NonNull< 工 > >XH, 

代码 第 8、9 行 可 以 通过 as_ptr 和 as_mnut 方 法 分 别 得 到 NonNull 天 工 > 
类 型 对 应 的 *mut 工 指针 和 &mnut T 引 用 。 注 意 ， 这 里 的 as_maut 方 法 得 到 的 
引用 是 有 正常 生命 周期 的 引用 ， 而 非 未 绑 定 生命 周期 的 引用 。 

代码 第 10 一 12 行 可 以 通过 NonNull:，: from 函数 将 一 个 可 变 引 用 转 
ANonNull<T> #2! 。 

RAGS 13 ~ 1547 null 函数 创建 了 一 个 空 指针 ， 然 后 传 给 
NonNull: : new 函数， 将 生成 None 值 。 

TIERE 

因为 NonNul 的 非 零 特 性 4» ARO AA Bm PEAS TM ， 如 代 
码 清单 13-42 所 示 。 


代码 清单 13-42: 空 指针 优化 展示 
use std::mem,; 
use std::ptr::NonNull; 
struct Foo { 
a: *mut uo4, 
b: *mut uo4, 


} 
struct FooUsingNonNull { 


ow] G OF &] W Nw FF 


a: *mut u6o4, 
b: NonNull<*mut u64>, 


EF KO 
| 人 


} 


fn main() { 


= e 
NO = 


println! ("*mut woi: {} bytes", mem::size of::<*mut uo4>()); 
13. printlin! ("NonNull<*mut u64>: {} bytes", 


14. mem::size of::<NonNull<*mut u6o4>>()); 

1S println! ("Option<*mut u64>: {} bytes", 

16. mem::size of::<Option<*mut. u64>>()); 

ie à println! ("Option<NonNull<*mut u64>>: {} bytes", 
Lo 。 mem::size of::<Option<NonNull<*mut u64>>>()); 
19. println! ("Option<Foo>: {} bytes", 

20 mem: :size of: :<Option<Foo>>()); 

2] println! ("Option<FooUsingNonNull>: {} bytes", 

LE a mem::size of::<Option<FooUsingNonNull>>()); 
Boe d 


代码 清单 13-42 中 定义 了 两 个 结构 体 Foo 和 FooUsingNonNull， 前 者 
只 用 了 原生 指针 ， 后 者 的 字段 中 包含 了 NonNul<*mutu64 之 指针 。 

在 main 函 数 中 ， 通 过 mem: : size_of 函 数 比 较 它 们 的 内 存 大 小 ， 代 
但 清单 13-43 展 示 了 输出 结 

代码 清单 13-43: 空 指针 优化 输出 结 


*mut u64: 8 bytes 

NonNull<*mut uo4>: 8 bytes 
Option<*mut u6o4>: 16 bytes 
Option<NonNull<*mut u64>>: 8 bytes 
Option<Foo>: 24 bytes 
Option<FooUsingNonNull>: 16 bytes 


从 代码 清单 13-43 中 可 以 看 出 ，*mut u64 的 大 小 和 NonNull<*mut 
u64> 405%, NonNull<*mut u64 之 和 Option<NonNul<*mut u64> >K 
NFASE, {Ae Option<*mut u64> WA) AI ANSEF *mut u64. 

这 是 因为 Rust 对 包 合 了 NonNull<T> 指 针 的 Option<T> 28 1T 
本 优化 行为 ， 这 种 优化 叫 作 “ 空 指针 优化 ”。 因 为 NonNull<T 二 本 里 古 不 
可 能 为 空 的 ， 所 以 Option 达 <T 二 束 不 需要 多 余 的 判别 式 Cag) 来 判断 是 
不 是 None， 这 样 在 内 存 布局 上 焉 不 需要 占用 多 余 的 内 存 。 而 对 *mnut Tis 
针 来 说 ， 无 法 保证 它 一 定 不 是 空 指 针 ， 所 以 Option 二 *mut u64>% 772 
保留 判别 式 ， 内 存 布 局 还 需要 按 正 常 的 枚 举 体 来 进行 对 章 ， 所 以 会 多 占 
用 一 倍 内 存 。 

宝 指 针 优化 固然 可 以 省 内 存 ， 但 在 使 用 FFI 和 C 语 言 “ 打 交道 ?的 时 候 
要 惯用 。 


13.2.6 Unsafe 5 Sue 


在 Unsafe Rust 中 就 需要 小 心 娩 屋 安全 ， 这 里 是 Rust 编 译 右 芥 长 喘 及 
的 地 方 ， 如 代码 清单 13-44 所 示 。 
代码 清单 13-44: Unsafe Rust? BERRA ij 


1. aimpl<T: Clone> Vec<T> | 

Ls fn push alb (èmut self, to push: &[T]) 4 

cr seli.reserve(to push. lent) )? 

4. unsafe { 

Ve seli.aeu Jen (selt.ten{) + Ea Push. Leni)? 
G6 Cor (i, X) in to Push Ltert}) enumerate) | 
Ts self.ptr().offset(1 as 1Size) .write(x.clone()); 
8 . } 

Bh | 

1D } 

Liew J 


代码 清单 13-44 为 Vec<T> 实 现 了 一 个 push_all 方 法 ， 在 第 3 行使 用 
reserve 预 留 了 传 入 数组 大 小 的 内 存 容量 。 然 后 使 用 了 unsafe 代 人 码 块 ， 
为 要 使 用 write 方 法 来 直接 窗 亲 内存 的 数据 ， 属 于 unsafe 操 作 。 

BEAN py BAUME — A A RB ACER ET ze «clone 方法 ， 因 为 其 他 方 
APB Ef AAR, FIFRA RAER TE, H 。 dlone 方 法 的 实现 是 未 知 
I, FETE AREA AD AE o MUA push_al K Bat He ZEN A 
数 ， 它 也 不 保证 内 存 安全 。 假 如 clone FIERA SRE, AAR 7c 
素 将 无 法 继续 写 入 内 存 ， 但 是 之 前 已 经 使 用 ”reserve 方法 预 分 配 了 内 
和 仓 ， 那 么 就 会 出 现 未 初始 化 的 内 存 ， 最 终 导 致 内 存 不 安全 。 但 是 出 于 
Rust 的 设计 ， 这 些 未 初始 化 的 内 存 并 不 会 梓 双 露出 来 。 押 以， 总 的 来 
说 ， 相 比 于 其 他 语言 ， 比 如 C++，Rust 程 序 员 几 平 不 会 担心 娩 屋 安全 的 
问题 。 

Rust 也 提供 了 catch_unwind DEREN Kae he, KE SAY 
Bike. (Axe, OT ASS 13-44} RAN ASE ic 224 AY push_all R BOK 
ti, WREE pecon TAKA Pes Ah, NWA. BARNES 
经 确定 ， 但 是 还 有 未 初始 化 的 内 存 ， 整 个 数据 结构 的 不 变性 被 破坏 了 。 
所 以 ，Rust 编 译 右 也 不 会 允许 开发 者 在 push_all 疯 数 中 使 用 


catch unwind. 


13.2.7 HEA FN Bc 


Em Unsafe “Rust 的 过 程 中 ， 也 需要 手动 进行 扒 内 存 分 配 ， 上 所 以 
Rust 标 准 库 std: : alloc 模 块 中 也 提供 了 堆 内 存 分 配 的 相关 API。 

Rust 在 Rust 1.28 之 前 默认 都 是 使 用 jemalloc 作为 默认 内 存 分 配套 ， 
虽然 jemalloc 很 强大 ， 但 它 也 市 来 不 少 问 题 ， 所 以 在 Rust 1.28 ”中 将 
jemalloc 分 配 右 从 标准 库 中 剥离 了 出 来 ， 作 为 一 个 可 选 的 第 三 方 库 而 存 
在 ， 标 准 库 默 认 分 配套 殉 是 System Ala 。 

在 std: : alloc 模 块 中 有 一 个 GlobalAlloc trait， 其 源码 如 代码 清单 
13-45 所 示 。 
代码 清单 13-45: GlobalAlloc trait 源 码 示 意 
pub unsafe trait GlobalAlloc { 

unsafe fn alloc(&self, layout: Layout) -> *mut u8; 


unsafe fn dealloc(&self, ptr: *mut u8, layout: Layout); 
// 其 他 方法 省 略 
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在 代码 清单 13-45 中 展示 了 GlobalAlloc 中 最 重要 的 两 个 方法 签 
Z: alloc 和 dealloc ， 分 别 表示 内 存 的 分 配 和 释放 。 

注意 ，GlobalAlloc 和 其 定义 方法 都 用 unsafe 做 了 标记 。 要 实现 该 
trait， 必 须 注 意 肚 和 守 以 下 约定 : 

:如果 全 局 分 配 堪 发 生 了 和 恐 慨 ， 则 会 产生 未 定义 行为 。 

:布局 (Layout) 的 查询 和 计算 必须 正确 。 

这 束 意 味 着 ， 开 发 者 可 以 通过 实现 该 trait ”而 指定 自己 的 全 局 分 配 
囊 。 如 代码 清单 13-46 所 示 。 
代码 清单 13-46: Bie Caz laa Bat Bl 


1. use std::alloc::{GlobalAlloc, System, Layout}; 

Z« etruct MyAlLlocator; 

3. unsafe impl GlobalAlloc for MyAllocator | 

4. unsbate in Allogo (ssel layout: Layout) -> MaE ve | 

SM System.alloc (layout) 

G } 

Ts unsafe fn dealloc(&self, ptr: *mut u8, layout: Layout) { 
Bi. System.dealloc(ptr, layout) 

he } 

LD 3 


11. #[global allocator] 

12. static GLOBAL: MyAllocator = MyAllocator; 
lis. £m. Maint) { 

14. // 此 处 Vec 的 内 存 会 由 GLOBAL 全 局 分 配器 来 分 配 
15% let mut v = Vec::new(); 

LS. ¥. Due (1) 

| a 

代码 清单 13-46 中 定义 了 结构 体 MyAllocator， 然 后 为 其 实现 
GlobalAlloc trait， 如 代 人 码 第 2~~10 行 所 示 。 上 其 体 的 实现 中 使 用 了 
System.alloc 和 System.dealloc 是 标准 库 默 认 的 分 配器 。 

(MiG 11, 12 行使 用 #[global_allocator] 属性 束 可 以 将 前 态 变 量 
GLOBAL 指派 的 MyAjllocator 声 明 为 全 局 分 配器 。 在 main 函 数 中 ，Vec 
<T> BUA A FE) BC as i BRU EA AE My Allocator7} ic 48 © 

HJA, th Ay Lita # [global_allocator] 属性 指定 全 局 分 配器 
为 jemalloc 。 如 代码 清单 13-47 所 示 。 

代码 清单 13-47: 声明 jemalloc 为 全 局 内 存 分 配器 

1. extern crate jemallocator; 
use jemallacator::Jemalloc; 
# [global allocator] 
Static GLOBAL: Jemalloc = Jemalloc; 
= EA Maant) {} 

代码 清单 13-47 展 示 了 如 何 将 jemalloc 设 置 为 全 局 内 存 分 配器 。 在 

Rust 1.28 中 ，jemalloc 分 配器 已 经 极 独 立 为 第 三 方 包 ， 叫 作 
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jemallocator。 这 也 是 需要 通过 extern crate 命令 导入 jemallocator 的 原因 。 


然后 同样 使 用 #[global_allocator] 属性 就 可 以 将 表态 变量 GLOBAL 
指派 的 Jamalloc 作 为 全 局 分 配 右 。 注 意 ， 该 属性 只 能 用 于 静态 变量 。 

同 理 ， 将 来 也 可 以 使 用 其 他 的 内 存 分 配 郁 ， 比 如 Redox 操 作 系 统 中 
用 纯 Rust 实 现 的 ralloc 内 存 分 配器 。 


13.2.8 AT ISA FEE = KIRN 


除了 前 面 介绍 的 编写 Unsafe 代 码 需 要 注意 的 事项 ， 还 有 来 自 Rust 社 
区 的 指导 Safe 和 Unsafe Rust 代 码 混合 编程 中 保证 内 存 安全 三 大 原则 MH 


不 安全 的 组 件 不 应 该 削弱 其 安全 性 ， 特 别 征 公共 的 API 和 数据 结 
人 构 。 
不 安全 的 组 件 应 该 尽 可 能 小 ， 并 与 安全 组 件 分 离 〈 隔 离 和 模块 
化 ) 。 
:不 安全 的 组 件 应 访 明 确 标记 并 轻松 升级 。 
在 开 友 中 订 循 上 述 原则 进行 淋 构 设计 ， 可 以 在 一 定 程度 上 获得 更 好 
的 安全 你 证 。 


13.3 和 其 他 语言 交互 


在 日 党 开发 中 ， 难 人 免 要 和 其 他 语言 进行 交互 。 其 中 ， 最 显而易见 的 
束 是 和 C 语 言 进 行 交 互 ， 比 如 Rust 程 友 要 进行 系统 调用 ， 或 者 退 过 Rust 
来 提升 动态 语言 的 性 能 瓶 领 。 这 也 是 几乎 所 有 编程 语言 都 要 面 对 的 问 
E o 

Common Lisp 语 言 规范 中 首次 提出 了 术语 “外 部 函数 接口 (Foreign 
Function Interface, FFI) ”， 用 于 规范 语言 间 调 用 的 语言 特征 。 后 来 ， 
该 术语 也 逐渐 被 引入 到 Haskell 和 Python 等 大 多 数 语 言 中 。 也 有 个 别 语言 
使 用 其 他 术语 ， 比 如 Ada 语言 使 用 “语言 绑 定 (Language Bindings) ”, 
Java 语 言 则 将 FFI 称 为 JNI (Java Native Interface) 。 

所 以 ， 现 在 编程 语言 之 国都 是 通过 FFI 技 术 来 进行 交互 的 。 


13.3.1 JP Hib ei Ae A 


FFI {ZARA EB Ree — Hee SIE 和 调用 约定 BSA 
一 种 编程 语言 的 语义 和 调用 约定 相 匹 配 。 如 何 匹 配 呢 ? 

不 害 哪 种 编程 语言 ， 无 论 是 编译 执行 还 是 解释 执行 ， 最 终 都 会 到 达 
处 理 豆 指令 这 个 环节 。 在 这 个 环节 所 处 的 层面 上 ， 编 程 语言 之 间 的 语 
法 、 数 据 交 型 等 语义 差异 均 以 消除 ， 只 需要 匹配 调用 约定 ， 这 瓯 给 编程 
语言 之 间 的 相互 调用 带 来 了 可 能 。 

应 用 程序 二 进 制 接口 

调用 约定 如 何 匹 配 ， 与 应 用 程序 二 进 制 接口 CABI) 高 度 相 关 。 

什么 是 ABI? ABI 是 一 个 规范 ， 主 要 闻 症 以 下 内 容 : 

调用 约定 。 一 个 图 数 的 调用 过 程 本 质 丈 是 参数 、 图 数 、 返 回 值 如 
何 传递 。 编 译 堪 按 照 调 用 规则 去 编译 ， 把 数据 放 到 相应 的 堆栈 中 ， 函 数 
的 调用 方 和 被 调用 方 RAAE) 都 需要 遵循 这 个 统一 的 约定 。 

内存 布局 。 规 定 了 大 小 和 对 齐 方式 。 

` 处 理 占 指令 集 。 不 同 平台 的 处 理 需 指令 集 不 同 。 

: 目标 文件 和 库 的 二 进 制 格式 。 


ABIHL y Hania. EFE, GEAR) AEREE E. ABLE it 
制 层 面 程序 兼容 的 契约 ， 只 有 拥有 相同 的 _ABI， 来 和 目 不 同 编译 器 之 间 
的 库 才 可 以 相互 链接 和 调用 ， 人 否则 将 无 法 链接 ， 或 者 即使 可 以 链接 ， 
也 无 法 正确 运行 。 

不 同 的 体系 结构 、 操 作 系 统 、 编 程 语言 、 每 种 编程 语言 的 不 同 编译 
右 实 现 基 本 都 有 目 己 规定 或 者 齐 循 的 ABI 和 调用 规范 。 目 前 只 能 通过 FFIi 
技术 遵循 C 语 言 ABI 才 可 以 做 到 编程 语言 的 相互 调用 。 也 就 是 说 ，C 语 言 
ABI 是 唯一 通用 的 稳定 的 标准 ABI。 这 是 由 历史 原因 决定 的 ，C 语 言 伴随 
者 操作 系统 一 路 发 展 而 来 ， 导 致 其 成 为 事实 上 的 “标准 ABT”。 

Rust 语 言 也 提供 了 ABI， 但 因为 Rust 语 言 目前 处 于 上 升 期 ， 语 言 还 
在 不 断 地 完善 和 改进 ， 导 致 ABI 还 不 能 够 稳定 下 来 ， 在 不 久 的 未 来 ， 
Rust ABI 应 该 是 可 以 稳定 的 。Rust 提 供 了 FFI 技 术 ， 人 允许 开发 者 通过 稳定 
的 C-ABI 和 其 他 语言 进行 交互 。 

图 13-2 展 示 了 Rust FFI 和 C 语 言 相 互 调 用 的 原理 。 





图 13-2: Rust FFI 和 C 语 言 相互 调用 原理 示意 
在 Rust 中 使 用 FFI 非 党 徐 单 ， 只 需要 通过 extern 关 键 字 ”和 ertern 块 
对 FFI 接 口 进行 标注 即 可 。 在 编译 时 会 由 LLVM 默 认 生 成 C-ABI。 
链接 与 Crate Type 
有 了 统一 的 ABI 之 后 ， 还 需要 经 过 链接 才能 实现 最 终 的 相互 调用 。 
链接 是 将 编译 单元 产生 的 目标 文件 按照 特定 的 约定 组 合 在 一 起 ， 了 最 
终生 成 可 执行 文件 、 静 态 库 或 动态 库 。 链 接 产 生 于 程序 开 肥 的 模块 化 。 


这 里 的 模块 是 指 编译 层面 的 模块 。 比 如 C 或 C++ 语言 中 每 个 文件 都 是 一 
个 编译 时 元 ， 所 以 也 可 以 说 是 一 个 编译 模块 ， 编 译 之 后 束 能 产生 一 个 日 
标 文 件 。Rust 和 C/C++ 不 同 ， 它 以 包 〈crate) 为 编 详 单元 。 在 一 个 Rust 
包 中 通过 extern crate 声 明 来 引入 其 他 包 之 后 ， 编 详 需 文 持 各 种 方法 可 以 
将 包 和 链接 在 一 起 ， 生 成 指 lod 动态 库 或 静态 库 。 

在 一 个 编译 模块 中 ， 通 党 包含 了 函数 和 全 局 数据 的 定义 。 函 数 和 数 
据 由 符号 来 标识 ， they 。 全 局 符号 可 以 在 模块 间 引 
用 ， HUSTED SA Re FE SAU BIR ST FH 编译 各 个 模块 的 时 候 ， Zin EAs HY 
一 项 重要 工作 就 是 建立 从 写 表 ”。 符 写 表 中 包含 了 模块 的 哪些 符号 是 全 
局 从 号， 哪些 是 静态 从 号 ， 每 个 符号 都 全 关联 个 地 址 在 链接 过 程 
H, BEC AS oe FA Fal Fe Pn ERAN TS , 建 并 全 局 但 与 表 ， 由 此 决 
定 ， 人 符号 在 哪里 被 定义 ， 以 及 在 哪里 被 调用 。 这 个 过 程 叫 作 和 外 iga 
o RIEZ Sh, FAA SAT IFA eA ke NEHE 
进行 存储 空间 的 分 配 。 地 址 重新 分 配 之 后 ， rd uated 
被 调整 ， 这 个 过 程 叫 作 重 定位 ”。 经 过 符号 解析 、 存 储 空 间 分 配 和 重 定 
位 之 后 ， 链 接 过 程 束 完成 了 ， 最 终生 成 可 执行 文件 或 库 。 

从 概念 上 看 ， 库 可 以 分 为 两 种 : 静态 库 和 动态 库 。 

RAJE 《是 这 样 一 种 库 : 在 功能 上 ， 可 以 在 链接 时 将 引用 的 代码 和 
数据 复制 到 引用 访 库 的 程序 中 ; 在 格式 上 ， 它 只 是 普通 目标 文件 的 集 
a, Axes Fhe. HAS He TEA fa AL, JRE LA HAN, (Be 
容易 浪费 空间 。 动 态 库 OMAP ASE AEE LEK. ASE) WAFER 
过 程 延 人 运 到 运行 时 进行 ， 比 如 章 定 位 发 生 在 运行 时 而 非 编译 时 。 动 态 库 
相对 来 说 比较 省 空间 。 

除 可 执行 文件 外 ，Rust 一 共 文 持 四 种 库 ， 如 图 13-3 所 示 。 


图 13-3: crate_type 类 型 示意 


可 以 通过 设置 命令 行 参数 Flag 或 者 crate_type 属性 指定 生成 的 库 类 





---crate-type=bin&\ # [crate_type= " bin " ]， 表 示 将 生成 一 个 可 执行 
文件 。 要 求 程序 中 必须 包公 一 个 main 函 数 。 

---crate-type=lib 或 #[crate_ type= " lib "] ， 表 示 将 生成 一 个 Rust 
库 。 这 里 jib 是 对 Rust 库 的 统称 ， 有 共 体 生成 什么 库 ， 由 编 详 玲 目 行 诀 定 。 
一 般 情 况 下 ， 默 认 会 产生 rlib 静态 库 。 

--cCrate-type=rlib 或 并 [crate type= " rlib"]， 可 以 理解 为 静态 Rust 
He, FA Rust3g ASK IEH - 

---crate-type=dylib = # [crate_type="dylib"] ， 可 以 理解 为 动态 
Rust 库 ， 同 样 由 Rust 编 详 需 来 使 用 。 该 类 型 在 Linux 上 会 创建 *.so0 文件 ， 
在 MacOSX 上 会 创建 *.dylib 文件 ， 在 Windows 上 会 创建 *.dll 文件 。 

---crate-type=staticlib = # [crate_type= " staticlib" ] ， 将 生成 静态 
系统 库 。Rnust 编 译 硕 永远 不 会 链接 该 类 型 库 ， 主 要 用 于 和 C 语 言 进行 链 
接 ， 达 成 和 其 他 语言 交互 的 目的 。 静 态 系统 库 在 Linux 和 MacOSX 上 会 创 
建 *.a 文件 ， 在 Windows 上 会 创建 *.lib 文件 。 

---crate-type=cdylib 或 并 [crate_ type= " cdylib"] ， 将 生成 动态 系 
统 库 。 同 样 用 于 生成 C 接 口 ， 和 其 他 语言 交互 。 访 类 型 在 Linux 上 会 创建 
*so 文件 ， 在 MacOSX 上 会 创建 *.dylib 文件 ， 在 Windows 上 会 创建 *.dll 
MF 

需要 注意 的 是 ，crate_type 可 以 指定 多 个 。 有 时 候 会 有 这 种 情况 出 
Bl: 包 A 依赖 包 了 B， 而 包 B 需 要 生成 一 个 staticlib 静 态 系 统 库 。 这 时 ， 融 
需要 为 包 B 同 时 指定 staticlib 和 nrlib 两 种 包 类 型 。 

只 要 ABI 统 一 ， 两 个 库 束 可 以 相互 链接 。 在 链接 之 后 ， 束 可 以 实现 
相互 调用 。 所 以 ，Rust 要 和 其 他 语言 交互 ， 可 以 通过 导出 为 C-ABI 接 口 
的 静态 库 或 动态 库 ， 然 后 其 他 语言 链接 该 库 ， 残 可 以 实现 语言 之 间 的 相 
互 调用 。 

交叉 编译 

以 上 说 的 是 本 地 编译 的 情况 ，Rust 也 支持 交叉 编译 ， 几 平 做 到 了 开 
箱 即 用 。 在 本 地 平台 上 编译 出 需要 放 在 其 他 平台 运行 的 程序 ， 允 叫 交 叉 
编译 。 比 如 ， 在 x86 和 平台 上 编译 可 以 在 ARM 授 入 式 单 万 机 上 运行 的 程 
FF 


可 以 使 用 rustc 进 行 交 又 编译 ， 只 需要 给 rustc 传 递 一 个 target ”参数 即 
可 。 如 代码 清单 13-48 所 示 。 
代码 清单 13-48: rustc 交 叉 编 译 命令 展示 
S$ rustc --target=arm-unknown-linux-gnueabihf hello.rs 


XP MLAT LATE So 7K, WR AEEPATARMIKASUTACE SE, UR 
Hhello.rs LFA He 18 A std tne He WRIA A 13-49FT a -o 
代码 清单 13-49: hello.rs 需 要 配置 好 no_std 
1. // hello.rs 
2 #! [crate type = "lib"™] 
3 #! [no std] 
4. fn main() { 
5 printlint ("Hello, worlda!™); 
Gs St 
因为 std 不 文 持 ARM 单 户 机 ， 所 以 这 里 使 用 了 并 ! [no_std] 属性 。 
当然 ,网 入 式 推 荐 的 做 法 应 该 是 使 用 core 。 
除了 rustc， 也 可 以 使 用 Cargo 进 行 区 叉 编译 。 使 用 方法 和 rustc 关 
似 ， 给 cargo build 命令 传递 --target 参数 即 可 。 默 认 情 况 下 ，cargo 命 令 
会 使 用 cc 作为 交叉 编译 的 链接 器 。 也 可 以 通过 修改 Cargo 的 配置 文件 来 
指定 链接 莫 。 如 代 但 清单 13-50 所 示 。 
代码 清单 13-50: 使 用 cargo 进 行 交 叉 编译 示意 
# 通过 配置 文件 指定 链接 器 
$ cat ~/.cargo/config 
[target.arm-unknown-linux-gnueabihf | 
linker = "arm-linux-gnuúueabihf-gcc-4.8" 
# 使 用 cargo 交叉 编译 
$ cargo new --bin hello 
5 cd hello 


$ cargo build --target=arm-unknown-linux-gnueabihf 


上 面 的 示例 中 ，target 参 数 后 面 类 似 于 arm-unknown-linux- 
gnueabihf 这 样 的 格式 ， 叫 作 target triple 格式 。Triple 格 式 古 交 义 编译 
前 必须 要 确认 好 的 ， 格 式 含义 如 下 : 


{arch}-{vendor}-{sys}-{abi} 


其 中 ，arch ”代表 编译 程序 的 主机 系统 ， 如 果 是 藤 入 式 系 统 ， 磺 是 
arm。 第 二 个 vendor 是 指 供 应 两 ， 如 果 是 未 知 ， 束 可 以 指定 为 unnknow。 
第 三 个 sys 代表 操作 系统 ， 比 如 Linux。 最 后 的 abi 代 表 的 是 ABI 接 口 ， 比 
如 gnueabihf 表 示 的 是 系统 使 用 glibc 作 为 C 标 准 库 〈libc) WEH, HHA 
便 件 加 速 浮 点 运算 (FPU) 功能 。 这 样 束 得 到 了 最 终 的 arm-unknown- 
linux-gnueabihf 目 标 triple 格 式 。 当 然 ， 有 时 候 也 可 以 省 略 最 后 的 abi， 比 
fi1x86_64-apple-darwin, wasm32-unknown-unknown2% l2 , 

Rust 和 社区 还 提供 了 第 三 方 交 叉 编 详 工具 xargo ， 使 用 该 工具 可 以 更 
方便 地 进行 交叉 编译 ， 还 允许 开 肥 者 构建 一 个 定制 的 std 库 。 当 前 ，Rust 
官方 者 手 进 行 xargo 和 rustup 工 具 的 整合 。 

extern 语 法 

Rust 提 供 了 extern 语 法 使 得 FFT 非 党 便于 使 用 。 

:extern 关 键 字 。 通 过 extern 天 键 字 声 明 的 图 数 ， 可 以 在 Rust 和 C 语 
言 中 目 由 使 用 。 

- extern 。 如 采 在 Rust 中 调用 C 人 代码 ， 则 可 以 使 用 extern 块 ， 将 外 
部 的 C 函 数 进 行 逐 个 标记 ， 以 供 Rust 内 部 调用 。 

编译 器 会 根据 extermn 语 法 自动 在 Rust-ABI 和 C-ABI 之 间 切 换 。 有 三 个 
extern ABIAZ 77 Bers Fa: 

- extern " Rust" ， 这 是 默认 的 ABI， 任 何 普 通 的 血 函 数 都 将 使 用 该 
ABI. 

-extern "C" ， 这 是 指定 使 用 C-ABI， 等 价 于 “extern fn foo O ”这 
样 的 函数 声明 。 

”extern " system" ， 这 和 exterm " C " 十 相 似 的 ， 只 十 在 Win32 乎 
合 上 等 价 于 "stdcall " 。 

除 此 之 外 ，Rust 还 支持 其 他 extern ”ABI 字符 串 ， 详 情 可 以 参见 官方 
Reference Slim (3! 。 另 外 还 有 三 个 Rust 编 译 器 专用 的 ABI 字 符 串 : 

- extern " rust-intrinsic " ， 代 表 Rust 编 详 需 内 部 函数 的 ABI。 

- extern " rust-call " ，Fn: : call 的 ABI。 


-extern " platform-intrinsic" ， 特 定 平台 内 在 图 数 的 ABI。 
接 下 来 ， 看 看 具体 如 何 使 用 extern 语 法 和 其 他 语言 进行 交互 。 


13.3.2 与 C/C++ 语言 交互 


C 语 言 这 种 万 能 “胶水 ”语言 荆 予 了 Rust 和 其 他 语言 通信 的 能 

Rust 中 可 以 方便 无 颖 地 调用 C 函 数 ， 所 以 对 于 现 有 的 操作 系统 和 一 
些 C/C++ 实 现 的 撒 层 系统 库 ， 可 以 使 用 Rust 进 行 安 全 无 颖 地 绑 定 和 扩 - 
展 ， 达 到 从 C/C++ 回 Rust 迁 移 的 目的 ， 甚 至 也 可 以 让 Rust 和 C/C++ 协 同 工 
作 。 比 如 ， 把 系统 中 对 安全 要 求 高 的 部 分 迁移 到 Rust， 其 余部 分 继续 用 
C/C++， 保 留 原 始 的 性 能 。 

通过 C-ABI，Rust 也 可 以 被 其 他 语言 调用 。 一 般 用 于 提升 动态 语言 
的 性 能 ， 比 如 Ruby、Python、Node.js 等 。 可 以 把 系统 中 造成 性 能 瓶颈 的 
部 分 用 Rust 来 重 写 ， 然 后 通过 FFI 在 动态 语言 中 调用 。 

在 Rust 中 调用 C 函 数 

代码 清单 13-51 价 单 展 示 了 在 Rust 中 调用 C 标 准 库 函 数 。 

代码 清单 13-51: Rust 中 调用 C 标 准 库 函数 


1. extern "C" { 

2 En Eom 132) => L32 

Sx d 

4 fn main() { 

Sa unsafe { 

6 printin! ("Is 3 a number ? the answer is: {}", isalnum(3)); 
了 // println! ("Is "a" a number ? ", isalnum('a')); 

8 

2. } 


代码 清单 13-51 中 ， 第 1 行 在 extern " C" HARE X T isalnum ži 
签名 。 然 后 在 main 函 数 中 就 可 以 直接 调用 操作 系统 C 标 准 库 内 置 的 
isalnum 函 数 。 这 里 也 可 以 直接 使 用 extern 块 ， 而 省 略 掉 ABI 字 符 串 " C 
" 。 因 为 默认 的 extern 块 就 是 按 C-ABI 处 理 的 。 

注意 ， 被 注释 的 代码 第 7 行 给 isalnum 函 数 传 入 了 字符 a’ ， 但 是 编 
译 会 报错 。 这 是 因为 在 extern 块 内 的 函数 签名 要 求 参 数 必须 是 数字 类 


型 。 可 以 看 出 ，Rust 的 类 型 系统 在 这 里 相当 有 用 。 

在 Rust 中 调用 C++ 函数 

在 Rust 中 也 可 以 调用 C++ 函数 ， 前 握 征 C++ 也 需要 使 用 C-ABI。 

现在 使 用 cargo 来 创建 一 个 新 的 bin 项 目 rustcallcpp， 如 代码 清单 13- 
52 所 示 。 

代码 清 单 13-52: 创建 新 项 目 rustcallcapp 

S cargo new --bin rustcallcapp 
接 下 来 修改 项 目 rustcallcapp 中 的 Cargo.toml 文 件 ， 如 代码 清单 13-53 


所 示 。 
代码 清单 13-53: 修改 Cargo.toml 文 件 


[package] 

name = "rustcallcpp" 

version = "0.1.0" 

authors = ["blackanger <blackanger.z@gmail.com>"] 


BULL. = THELLE. re" 
edition = "2018" 
[build-dependencies] 


cao = "1.0" 


代码 清单 13-53 中 ， 添 加 了 build.rs 文 件 配置 ， 以 及 build 依 赖 库 cc A 
。Rust 中 和 想 要 调用 C/C++， 首 先 需 要 链接 C/C++ 生 成 的 静态 /动态 库 。 可 
以 通过 手动 调用 gcc 或 g++ 来 编译 C/C++ 文 件 ， 使 用 ar ”工具 来 生成 静态 
库 。 但 是 ， 现 在 是 制作 Rust 的 crate， 这 些 工 作 需 要 自动 化 。 所 以 这 里 要 
利用 build.rs 文件 ， 在 Rust 构 建 之 前 ， 将 依赖 的 C/C++ 库 打 包 好 。 构 建 依 
赖 的 库 cc 是 对 gcc 等 各 大 平台 C/C++ 编译 右 的 抽象 。 

接 下 来 在 rustcallcpp 项 目 中 创建 一 个 文件 夹 cpp_src， 用 于 放置 
C++ 代 人 码 。 在 目录 中 创建 sorting.cpp 和 sorting.h 文 件 。 整 个 项 目的 目录 结 
构 如 代码 清香 13-54 有 所 示 。 

代码 清单 13-54: 当前 rustcallcpp 文 件 目录 结构 


|— Cargo. Loek 

| 一 Cargo. Coml 

| 一 build.rs 

-一 Cpp sre 

| -一 sorting.cpp 
| L— sorting.h 


该 目录 中 的 sorting.cpp 文 件 正 是 Rust 中 调用 的 C++ 图 数 定 义 所 在 。 如 
代码 清单 13-55 所 示 。 


代码 清单 13-55: sorting.cpp 代 三 


二 

Zs vold interop Sort numbers([], size t size) 

Sa d 

4. int* start = &numbers[0]; 

5 int* end = &numbers[Q0] + size; 

6 sbd: gort (start; end, [|] {anc x, ant y} | return x > yr })3 
7 } 


在 sorting.cpp 中 定义 了 一 个 排序 函数 interop_sort， 接 收 两 个 参数 ， 
分 别 是 数组 和 数组 长 度 。 然 后 调用 C++ 内 置 的 Sort 函数 对 传 入 的 数组 进 
AT FEF 

在 Sorting.h 头 文件 中 ， 为 其 声明 C 接 口 。 如 代码 清单 13-56 所 示 。 

代码 清单 13-56: sortingh 头 文件 代码 


1. #ifndef SORTING H | 

2» define SORTING HL “sorting..h" 
3. #include <iostream> 

4. #include <functional> 

5. #include <algorithm> 

6. #ifdef cplusplus 

ia er "W" i 

8. #endif 

i VOLS IUTE ron Sore (atl |, SILE T)? 
10. #ifdef cplusplus 

Lis J 

12. #endif 

13. #endif 


在 Sorting.h 头 文件 中 ， 使 用 extern " C" finterop_sorteh žit H AC 
接口 ， 以 便 在 Rust 中 调用 。 
接 下 来 ， 在 src/main.rs 中 调用 该 冰 数 ， 如 代码 清早 13-57 所 示 。 
代码 清单 13-57: src/main.rs 代 码 
1. #[link(name = "sorting", kind = "statiec™) ] 


2 。 extern { 


i fh interop Sort (GE: &[132710],;, at U32)? 

A. | 

Ss pub En gort from cpplarrs G@liszrlll, ni Us2) 4 
bi unsafe { 

To INCErOp. Serciart, 1); 

8. } 

9s | 

10. fn main() { 

si HA Let. my Sf: [a32 LO] = [10, 42, D, 12, G, 28, Tp 1a, S6, 11? 
LE printin! ("Before sorting..."); 

13s princi! ("isi Ys my arr); 

14. sort from cpp(&my arr, 10); 

L5. printin! ("Arter Sortang...™")} 

LD. printini ("{s7e", my arr); 

Lig J 


代码 清单 13-57 中 ， 人 代码 第 1 行使 用 # [link (name= " sorting " 
kind= " static" ) ] 属性 ， 表 示 和 Rust 链 接 的 是 名 为 jibsorting 的 静态 库 
上 |。 该 属性 也 可 以 省 略 ，Rust 会 使 用 默认 生成 的 名 字 。 这 个 属性 主要 
用 于 在 需要 的 时 候 指 定 链接 库 的 名 字 。 

代码 第 2 一 4 行 在 extem 共 中产 明了 interop_sort 的 函数 签名 。 注 意 输 
入 的 参数 类 型 ， 第 一 个 是 数组 的 引用 ， 因 为 C++ 中 的 数组 实际 上 束 是 指 
针 ， 这 里 要 对 应 起 来 。 

FETISHES ~ 947 FE XM S Rusth K Wsort_from_cpp, 7ex*fC++ 
interop_sorteAl AH) EMR. HE RK Emain ek BCH ET al - 

到 目前 为 止 ，C++ 和 Rust 两 头 的 代码 都 写 完 了 了， 是 不 是 可 以 直接 编 

详 运 行 了 呢 ? 其 实 还 兰 一 个 步骤， 那 就 是 编写 目 动 链接 的 代码 。 还 记得 
build.rs 文 件 吗 ? 如 代码 清单 13-58 所 示 。 

代码 清单 13-58: build.rs 


extern crate cc; 
fn main() { 
Ge. e Bui ld: enew () 


.CPP (true) 


,-Elagt’—Wal.* ) 


1 

2 

3 

4 

Sse .warnings (true) 
6 

7 ‘1 F144"} 
8 

> 


a L-g] 

£216 ("epp Sre; Sorting. Cpp") 
LQ, compile ("sortung") 7 
Ile J 


在 代码 清单 13-58 中 ， 使 用 了 cc 库 。 通 过 指定 的 参数 ，cc 库 会 帮助 开 
及 者 把 cpp_src 中 的 C++ 文件 进行 编 详 并 目 动 生成 静态 库 。 人 整个 过 程 相 当 
于 以 下 操作 : 
g++-Wall-std=c++14-c sorting.cpp ， 使 用 g++ 编 详 sorting.cpp 文 
件 。 
- ar rc libsorting.a sorting.o ， 通 过 ar 制作 一 份 静 态 库 libsorting.a。 
现在 就 可 以 执行 cargo run 命 令 来 运行 代码 了 。 输 出 结果 如 代码 清早 
13-59 上 所 示 。 
代码 清单 13-59: 输出 结果 
Before sorting... 
Ls “ay 2y TA, Bs 23a Pe Loy 59; =L] 
After sorting... 
[三 对。 = Fy da 295p G2, D9] 


看 得 出 来 ，C++ 中 的 排序 函数 输出 了 正确 的 结果 。 值 得 注 章 的 是， 
如 束 main.rs 中 传 入 的 数组 长 度 小 于 10 位 ， 或 者 大 于 10 位 ， 均 会 引起 Rust 
编译 器 报错 。 这 也 从 侧面 反映 了 从 C++ 迁移 到 Rust 有 利于 提升 程序 的 健 
壮 性 。 同 时 ， 如 果 查 看 target/debug/build 文 件 夹 ， 会 看 到 生成 的 
cpp_src/sorting.o 和 libsorting.a 文 件 。 

如 末 不 使 用 cc 库 ， 也 可 以 在 build.rs 文 件 中 使 用 Command: : 
new C" gtt") 等 命令 来 目 动 化 编 详 C++ 文 件 的 过 程 ， 但 是 不 如 cc 库 方 
便 。 当 然 ，cc 库 也 可 以 用 于 编写 C 绑 定 。 


在 C 中 调用 Rust 郧 数 
在 C 中 调用 Rust 疯 数 中 的 思路 同样 也 是 通过 静态 库 或 动态 库 进 行 链 
接 的 。 现 在 通过 cargo 命 令 创 建 callrust 项 目 ， 如 代码 清单 13-60 所 示 。 
代码 清单 13-60: 创建 callrust 项 目 
S cargo new --lib callrust 
为 了 生成 链接 库 ， 必 须 使 用 --lib 参 数 创建 库 类 型 的 项 目 。 然 后 进入 
callrust 项 目 中 ， 创 建 需要 的 文件 ， 目 录 绪 构 如 代码 清单 13-61 所 示 。 
代码 清单 13-61: callrust 目 录 结 构 
— Cargo.toml 


— c src 


| L— main.c 
— makefile 
[| sre 


— Call ewes. 
L_ 1ib .rs 
注意 代码 清单 13-61 中 ， 狐 增 的 文件 夹 和 文件 包括 以 下 四 个 : 
“ CcC_src， 用 于 存放 CC 文件。 
: C_src/main.c， 用 于 编写 C 代 人 码 。 
. Src/callrusth， 用 于 编写 Rust 么 露 的 外 部 C 接 口 。 
. makefile， 上 自动 化 编译 链接 过 程 。 
fe RK, 1EeXCargo.toml XF, WRIA 4413-62 AN. 
代码 清单 13-62: 修改 Cargo.toml 文 件 


[dependencies] 

Libe="0..2" 

(Peasy 

name = "callrust" 

Crate-type = ["staticlib”, "“edylib"] 


在 Cargo.toml 文 件 中 增加 libc 依赖 。libc 库 是 对 各 大 操作 系统 平台 C 
标准 库 的 Rust 抽 象 ， 其 中 对 C 标 准 库 接口 函数 做 好 了 Rust 绑 定 ， 可 以 直 


接 拿 来 使 用 。 
同时 也 设置 了 Rust 链接 库 的 名 称 为 callrust 。 指 定 了 生成 两 种 类 型 
的 链接 库 : staticlib 和 cdylib  ， 分 别 代表 兼容 C-ABI 的 静态 库 和 动态 
库 。 
然后 修改 Srwlib.rs 文 件 ， 如 代码 清单 13-63 所 示 。 
代码 清单 13-63: 修改 srclib.rs 文 件 
use libc; 


# [no mangle] 


1 
2 
oe BUS extern In print hello Trom Thst(y 4 
4 printin! ("Hello from Rust"); 

5 


« 

代码 清单 13-63 中 引入 了 libc 库 。 同 时 定义 了 print_ hello_from_rust 函 
数 ，pub extern 关键 字 声 明 表 明 该 图 数 为 外 部 调用 接口 ，extern 默 认 是 
兼容 C-ABI。 

At, #[no_mangle] 属性 是 告诉 Rust 关 闭 函 数 名 称 修 改 功 能 。 如 
果 不 加 这 个 属性 ，Rust 编 译 如 束 会 修改 水 数 名 ， 这 是 现代 编译 硕 为 了 解 
决 唯一 名 称 解 析 引 起 的 各 种 问题 所 引入 的 技术 。 如 果 函 数 名 被 修改 了 ， 
那么 在 C 代 码 中 玖 无 法 按 原 名 称 调用 ， 开 发 者 也 没 办 法 知 填 修改 后 的 函 
BN o 

fee RFT F src/callrust.- hk XF, ÆA AA print_hello_from_rustef 
数 。 该 头 文 件 将 用 于 C 和 Rnust 库 的 链接 。 如 代码 清单 13-64 所 示 。 

代码 清单 13-64: 修改 srccallrust.h 文 件 

lx yoida print. Nelle Trom rust () 3 

faye 213-65 A - 

代码 清单 13-65: 修改 c_srcomain.c 文 件 


#include "callrust.h" 
#include <stdio.h> 
#include <stdint.h> 
#include <inttypes.h> 


int main (void) { 


ogo OF S Ww NO P 


print hello from rust); 
te J 


代码 清单 13-65 中 引入 了 callrusth 头 文件 ， 以 及 其 他 标准 头 文件 。 
然后 在 main 函 数 直 接 调用 print_hello_from_rust 函 数 。 

接 下 来 还 需要 编写 makefile 文件 ， 这 样 束 可 以 把 编译 链接 过 程 通 过 
make 命令 进行 目 动 化 处 理 ， 如 代码 清单 13-66 所 示 。 

代码 清单 13-66: 修改 makefile 文 件 


La GCC BIN ?= $(shell which gcc) 
2. CARGO BIN ?= $(shell which cargo) 
3x runs clean build 
4. ./c src/main 
5. clean: 
Gi. S (CARGO BIN) clean 
Vs Mm. =f fG srermain 
Ss Dulld: 
9, $ (CARGO BIN) build 
LO. “(GCC BIN) -o ./c src/main ./c src/main.c -Isre -L ./target/debug 
sleali Fust 


代码 清单 13-66 中 定义 了 三 个 make 命 令 : run . clean 和 build 。 其 
中 build 命 令 包含 两 步 操作 : 

通过 cargo build 命令 构建 Rust 程 序 ， 生 成 已 指定 的 C-ABI 兼 容 的 
静态 库 和 动态 库 。 

:使 用 gcc 命令 编译 C 人 代码 ， 链 接 Rust 库 ， 生 成 目标 二 进 制 可 执行 文 
件 main 。 

注意 makefile 文 件 中 的 缩 进 ， 必 须 是 制 表 符 Cab) ， 而 非 空格 。 

接 下 来 束 可 以 在 项 目 根 目录 下 执行 make 命 令 或 make run 命 令 ， 编 详 
并 运行 程序 ， 和 输出 结果 如 代码 清单 13-67 所 示 。 


代码 清单 13-67: 输出 结果 
fusr/bin/gcc -o ./c src/main ./c src/main.c -Isre -L ./target/debug 
-lealLLeust 
./c src/main 
Hello from Rust 
代 但 清单 13-67 得 出 结 末 中 包含 了 make 执 行 的 命令 ， 以 及 最 终 
print_hello_from_rust 函 数 的 执行 结果 。 
类 型 匹配 与 内 存 布局 
前 面 的 演示 代码 中 ， 没 有 展示 Rust 和 C 相 互 传递 参数 的 情况 。 实 际 
上 ， 在 开 肥 Rust 和 C 相 互 调 用 的 程序 时 ， 根 本 无 法 避免 相互 传递 参数 。 
所 以 ， 在 需要 传递 参数 的 情况 下 ， 必 须 保证 参数 的 类 型 和 内 存 布局 可 以 
满足 调用 约定 。 
继续 使 用 callrust 项 目 作为 演示 。 在 Rust 中 实现 一 个 检测 字符 串 长 度 
的 函数 ， 然 后 在 C 中 调用 。 在 callrust 项 目的 Srclib.rs 中 添加 代码 ， 如 代码 
清单 13-68 所 示 。 
代码 清单 13-68: 在 src/lib.rs 中 新 增 代 人 码 
Mae Jee SD Ghar, © UINE)? 
uses Sade: fis uD bey 
# [no mangle] 
pub extern Th hm Chars iss ?Onnst & Bhar) -> @ TINT | 
LE © Str = Unsale 4 
assert (ls. Ls mull()}; 
SEE pre (sé) 
}; 


Let © SCE 一 


WO Ons! oO A e w BD EF 


LO Yr str. ¢chars(|).count() as o uint 


代码 清单 13-68 中 ， 定 义 了 外 部 接口 函数 hm_chars， 诅 图 数 主 要 用 
于 统计 传 入 的 字符 串 长 度 。 这 时 残 应 该 考虑 这 样 一 个 问题 : 该 函数 会 在 
C 代 码 中 被 调用 ， 但 是 C 语 言 中 的 字符 串 是 一 个 以 “\n ”结尾 的 字符 数 
组 ， 实 际 上 由 一 个 char*str 指针 来 定义 。 那 么 在 Rust 中 定义 该 函数 时 ， 
参数 的 闫 型 应 该 是 什么 ? 如 图 13-4 所 示 。 


C 
ABI 


i a 
传人 
c char *str ee 
统一 


图 13-4: C 中 调用 Rust 函 数 参 数 类 型 示意 

C 中 调用 hm_chars 函 数 时 传 入 char*str 指 针 ， 所 以 Rust 中 定义 该 函数 
时 ， 也 应 诅 注 意 参 数 的 类 型 与 C 语 言 的 char*str 指 针 相 匹配 。 

Rust 的 Char 类 型 和 C 的 Char 类 型 完全 不 同 ， 在 Rust 中 Char 类 型 是 一 个 
Unicode 标 量 值 ， 但 是 C 中 Char 只 是 一 个 普通 的 整数 。Rust 标 准 库 在 
std: : os: : raw 模 块 中 提供 了 与 C 语 言 中 各 种 类 型 相 匹 配 的 映射 类 
型 。 比 如 提供 了 c_char 类 型 ， 其 实 束 是 ”i8 ”类 型 的 别名 。 所 以 ， 
hm chars 了 水 数 的 参数 可 以 标注 为 std: : os_raw 模 块 中 有 的 c_char 类 型 。 

但 是 在 callrust 项 目 中 己 经 依赖 了 libc 库 ， 该 库 也 提供 了 对 C 中 基本 数 
据 次 型 的 有 映射。 在 本 示例 中 选择 使 用 libc 库 中 的 c_char 疾 型。 通 第 情况 
下 ， 使 用 std: : os: : raw 模 块 或 libc 都 没有 什么 区 别 ， 除 非 使 用 了 libc 
特有 的 功能 。 但 是 需要 知道 一 个 事实 ，libc 库 不 依赖 ssd， 所 以 请 根据 实 
际 的 使 用 情况 进行 选择 。 

在 Rust 函 数 内 部 进行 处 理 的 时 候 ， 需 要 转换 成 Rust 中 的 字符 串 炎 
型 。 为 了 方便 转换 ，Rust 标 准 库 std: : 值 模块 中 提供 了 CStr 类 型 ,该 
类 型 会 产生 一 个 以 “An 字符 数组 的 引用 。 所 以 在 代码 第 5 一 8 行 移 通过 
CStr: : from 肖 数 将 c_char 字 符 类 型 转 成 Rust 可 用 有 的 CStr 类 型 。 当 然 ， 要 
判断 传 入 的 字符 串 是 否 为 空 。 

在 代码 第 9 行 ， 将 CStr 类 型 的 字符 串 转 换 成 &strl 类 型 ， 然 后 在 第 10 
行 中 通过 调用 chars 方 法 转换 成 Rust 的 字符 数组 ， 通 过 调用 数组 的 count 方 
法 进行 字符 串 长 上 度 统 计 ， 最 终 返 回 统计 数字 。 这 里 需要 再 次 注意 ， 访 返 
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型 。 这 里 使 用 了 libc 库 中 定义 的 c_uint 类 型 。 

接 下 来 ， 在 callrust.h 头 文 件 中 诬 加 hm_chars 国 数 的 声明 ， 吏 可 以 保 
证 其 在 链接 之 后 在 C 代 人 码 中 被 调用 。 如 代码 清单 13-69 所 示 。 

代码 清单 13-69: 在 src/callrust.h 头 文件 中 新 增 代 码 


1. #include <inttypes.h> 


Z Hintsa Tt M ehars (const char *S LE) ; 


hi 213-69 XS Paty FAA, H Phm_charsik PRECA S P 
是 uint32_t 类 型 ， 该 类 型 在 inttypes.h 头 文件 中 被 定义 ， 所 以 这 里 需要 
BLATZ AAL Fe 

然后 回 到 c_styvmain.c 文 件 中 ， 在 main 国 数 中 调用 hm_chars 函 数 。 如 
代码 清单 13-70 所 示 。 

代码 清单 13-70: 在 c_styvmain.c 文 件 的 main 函 数 中 新 增 代 码 


由 


FA 
代码 清单 13-70 展 示 的 是 在 main 函 数 中 新 增 的 两 行 代 但。 第 1 行 调用 
hm_chars 疯 数 ， 传 入 字符 串 字 面 量 ， 返 回 值 赋值 给 count 变 量 。 第 2 行 输 
出 count 的 值 。 
在 命令 行 中 ，callrust 项 目 根 目 录 下 执行 make 命 令 ， 代 人 码 正常 编译 运 
行 。 输 出 结果 如 代码 清单 13-71 所 示 。 
代码 清单 13-71: 执行 make 后 的 输出 结 
/ /此 处 省 略 挥 之 前 函数 的 输出 
LƏ 
看 得 出 来 ， 输 出 结果 是 正确 的 。 
接 下 来 ， 在 src/lib.rs 中 实现 为 外 一 个 函数 ， 如 代码 清单 13-72 所 示 。 
代码 清单 13-72: 在 src/lib.rs 中 实现 新 的 函数 


Use SEA Elie ai Ceer, Cecring); 

use std::iter; 

# [no mangle] 

pos extern In Darman song length: 0 Tt -> MOE © Ghar | 
Let müt Song = SLringi:teon( "boom Ts 
song.extend(iter::repeat("nana ").take(length as usize)); 
song.push str("Batman! boom") ; 
Let ¢ STE song = CSrtrings DEW (Sond) Unwrap) $ 


iD ( =] cy ke sa fo Bo fF 


一 一 
Cc > ° 


E Sti song- iito Faw 
} 
代码 清单 13-72 中 定义 了 新 的 图 数 batman_song， 它 的 目的 是 输出 一 

字符 串 “boom nana nana nana Batman! boom”， 可 以 称 其 为 “蝙蝠 侠 之 
歌 ”。 该 字符 串 中 的 人 nana" 可 以 重复 ， 重 复 次 数 是 由 batman_song 函 数 的 
参数 来 指定 。 

该 函数 在 C 代 人 码 中 被 调用 ， 传 入 C 语 言 的 一 个 数字 类 型 ， 然 后 创建 
Rust 的 一 个 String 字 符 串 ， 只 有 String 字 符 串 才 可 以 动态 扩展 。 接 着 通过 
std: : 值 模块 中 的 CString 类 型 将 String 转 换 成 C-ABI 兼 容 的 字符 串 。 这 
里 和 CStr 的 区 别 是 ， 因 为 String 是 拥有 所 有 权 的 数据 类 型 ， 所 以 需要 使 
用 CString。 如 代 人 码 第 8 行 和 第 9 行 所 示 ， 先 由 String 创 建 CString 类 型 的 数 
据 ， 然 后 通过 into_raw 方 法 转换 为 C 兼 容 字 人 符 串 。 

因为 CString 是 拥有 上 所有权 的 结构 ， 现 在 将 其 返回 为 smut c_char 类 
型 ， 供 C 代 人 码 使 用 。 所 有 权 的 概念 只 存在 于 Rust， 在 C 代 人 码 中 使 用 完毕 ， 
该 字符 串 的 内 存 不 会 极目 动 清理 。 所 以 还 必须 再 实现 一 个 释放 字符 串 内 
存 的 方法 供 C 人 代码 调 用 ， 如 代码 清单 13-73 所 示 。 

代码 清单 13-73: 在 srclib.rs 中 增加 新 的 函数 free_song 

1. #[no mangle] 
2 pug extern in tree songiss “mb © char) 1 
5 unsafe { 
a. If 6.15 null() { return } 
3 CString: :from_raw(s) 
6 
7 


té 


代码 清单 13-73 中 ， 新 增 了 函数 free_song， 主 要 是 将 *mut c_char 
指针 类 型 通过 CString: : from 函 数 转 换 为 CString 类 型 的 字符 串 ， 然 后 刺 
可 以 交 给 Rust 编 译 右 按 所 有 有 权 机 制 目 动 释放 内 存 。 
接 下 来 需要 在 srccallrust.h 头 文件 中 声明 上 面 两 个 函数 ， 以 便 在 C 中 
可 以 被 调用 ， 如 代码 清单 13-74 所 示 。 
代码 清单 13-74: 在 src/callrust.h 尖 文件 中 增加 新 的 函数 声明 
1. // 省 略 其 他 函数 声明 
2. char * batman song(uint8 t length); 


3s Word Tree song(char ~); 


然后 打开 c_srcmain.c 文 件 ， 在 main 函 数 中 调用 ， 如 代码 清单 13-75 
所 示 。 
代码 清单 13-75: 在 c_src/main.c 文 件 的 main 哨 数 中 调用 
1. // 省 略 其 他 代码 
2 char “song = batman song(9); 
Se Pprintr("ssyn", sone); 
4 


free song(song) ; 


代码 清单 13-75 中 ， 调 用 完 batman_song 函 数 之 后 ， 还 需要 调用 
free_song 国 数 释 放生 成 的 字符 串 对 应 的 内 存 ， 人 否则 会 引起 内 存 刘 漏 。 总 
之 ， 需 要 记 住 ， 由 谁 分 配 内 存 ， 吏 由 谁 来 释放 。 本 例 中 是 由 Rust 分 配 了 
扒 内 存 〈String 字 符 串 ) ， 所 以 依然 需要 由 Rust 来 释放 内 存 。 
在 终 六 执 行 make 命 令 之 后 ， 代 码 正 党 编译 运行 ， 输 出 结果 如 代码 清 
单 13-76 所 示 。 
代码 清单 13-76: 输出 结果 
// 此 处 骨 略 之 前 函数 的 输出 
boom nana nana nana nana nana Batman! boom 
输出 结果 如 预期 显示 ， 说 明 调 用 正常 。 
Rust 和 C 之 间 除 了 可 以 相互 传递 字符 串 ， 还 可 以 传递 更 复杂 的 交 
型 ， 比 如 切片 、 元 组 和 结构 体 等 。 
现在 编写 一 个 疯 数 ， 用 于 计算 整数 数组 中 奇数 元 素 之 和 ， 如 代码 清 
单 13-77 所 示 。 


代 公 清早 13-77: Esrc/lib.rsiy 4 pK AX 


l- úse Stdaislice; 

2 # [no mangle] 

3s pub extern In Sum of Svenint “Const © uin; Len: € mint) => € aint 
Ga { 

sA let numbers = unsafe { 

6 assert: (in.is null) ); 

7 slice::from raw parts(n, len as usize) 
bi 

9 let sum = numbers .1ter() 

EU; wftilter(|&v| v 3 2 == 0) 

Lis ll lace; v| ate + Vis 

‘is sum as c uint 

Lee J 


CC 函数 中 的 数组 吏 是 指针 加 数组 长 度 ， 对 应 于 Rust 中 融 是 切片 关 
型 。 所 以 代码 清单 13-77 中 新 增 的 函数 sum_of _even 的 参数 殉 是 *const 
c_uint 类 型 的 指针 ， 以 及 c_uint 类 型 的 长 度 。 

在 代码 第 5 一 8 行 ， 使 用 Slice: : from_raw_parts 函 数 将 C 语 言 对 应 的 
PUA AMI Fr RA. AEAN RILIR, RR TE 
并 累计 剩余 奇数 之 和 。 最 终 将 求 和 结果 返回 。 

修改 src/callrust.h 头 文件 ， 声 明 访 图 数 ， 如 代码 清单 13-78 所 示 。 

代码 清单 13-78: 在 srccallrust.h 头 文件 中 新 增 函 数 声 明 
1. // 省 略 其 他 函数 声明 
2. #include <stdio.h> 
3. INESSA € Sum of even (const uintsz t *numbers, size € length); 


在 代码 清单 13-78 中 ， 需 要 引入 stdio.h 头 文件 ， 因 为 函数 签名 中 用 
到 了 size t 类 型 。 

接 下 来 在 c_srcmain.c 文 件 的 main 函 数 中 添加 调用 代码 ， 如 代码 清单 
13-79 上 所 示 。 

代码 清单 13-79: 在 c_src/main.c 文 件 的 main 哨 数 中 调用 


// 省 略 其 他 代码 
uint32 © numbers[6] = {1,2,3,4,5,6}; 


UINt32 七 sum = Stim Of Eeven(numbers, 6); 


mm W NO FF 


printf ("sd\n", sum); 


执行 make 命 令 ， 可 以 看 到 正确 的 输出 结 

在 C 和 Rust 之 间 如 何 传递 元 组 ” 呢 ?”C 语 言 中 虽然 没有 元 组 类 型 ， 但 
是 有 结构 体 ， 可 以 用 结构 体 来 模拟 元 组 ”。C 和 Rust 之 间 可 以 传 违 结构 
体 ， 只 需要 满足 调用 约定 即 可 ， 如 代码 清单 13-80 所 示 。 

代码 清单 13-80: 在 srcdlib.rs 中 新 增 处 理 元 组 相关 代码 
#[repr (C)] 
pub struct Tuple 1 
x. © Urn; 


ye © U 


T 

2 

3 

4 

ax J 
6 impl From<(u32, u32)> for Tuple { 

7 fn Tromccup: (sz, ZI) => Tuple 1 
8 Topple 4 x: Ti 0 i Top. } 

9 

上 


Ue d 


Illa imel FromTuple> for (G34; usZ) 4 

I2., Lh Cremitup: TURLE) -> (Q34; Use) 4 

Las Pe Een) 

14. } 

lòs J 

Lo EA, Semple LI (Hady Dol) wo Ciao, Ua 4 
A Nhs e let (a, b) = tup; 

LO Hotl aL) 

ls J 


20. 并 [mo mangle] 
le PUD SCS fh FLIP things aroma (Tips Pupils) -> Tupe | 
Bia compute tuple (tup. inte ()) .inte() 


iS $13-80'7, 15TA T Aa ATuple, Ce HRW Iu 
组 的 。 访 结构 体 使 用 #[repr (C) ] BE, KWE WATA ak ECR 
ABI. Æ CHI Rust 之 间 传 递 元 组 ， 本 质 就 是 传递 该 结构 体 。 
代码 第 6 一 9 行为 Tuple 结 构 体 实现 From< (u32, u32) >, eA 
了 方便 将 Rust 的 〈u32，u32) 元 组 类 型 转换 为 Tuple 类 型 。 同 理 ， 代 码 第 
10~1547 AN (u32, u32) SEU fFrom<Tuple>, A J Tupe% wi 
转 为 元 组 类 型 。 
代码 第 16 一 19 行 用 于 计算 元 组 中 的 元 素 ， 并 返回 新 的 元 组 。 
代码 第 20 一 23 行 则 定义 了 外 部 函数 接口 flip_things around, $R 
数 内 部 调用 了 compute_tuple 隙 数 。 注 意 ， 调 用 tup.into 方 法 是 将 Tuple 转 
换 为 元 组 类 型 ， 传 到 computer_tuple 函 数 中 进行 计算 ， 并 在 之 后 返回 新 
的 元 组 。 然 后 再 侈 调用 into 方 法 ， 则 可 以 由 元 组 转换 为 Tuple 类 型 并 人 返 
[A] 。 
接 下 来 修改 srccallrust.h 头 文件 ， 如 代码 清单 13-81 所 示 。 
代码 清单 13-81: 在 src/callrust.h 汰 文件 中 新 增 函 数 声 明 
1. // 省 略 其 他 函数 声明 
2 typedef struct { 
a 了 二 上 € x? 
4 uint32 t y; 
3 人 
6 tüple t flip things sronda (tuple E} 
代码 清单 13-81 中 定义 了 结构 体 tuple_t ， 和 Rust 中 定义 的 Tuple 结 构 
体 相 对 应 。 之 后 ， 再 修改 srv/main.c 文 件 中 的 main 函 数 ， 如 代码 清单 13- 
82 FTA « 
代码 清单 13-82: 在 c_src/main.c 中 新 增 函 数 调用 
1. // 省 略 其 他 代码 
om Guple t initial = 4 x 3 LO «y = 20 F 
Ss tiple t new = Tlip Thrngs around (initial); 
4. printf("(%d,%d)\n", new.x, new.y); 


代码 清单 13-82 中 ， 初 始 化 了 tuple_t 类 型 的 结构 体 实 例 ， 然 后 传 入 
flip_things_around 函 数 中 ， 并 分 别 打印 结构 体 字段 x 和 y 的 值 。 在 执行 


make 命 令 之 后 ， 输 出 结果 按 预 期 显示 为 “(21，9) ”. 

WR C 和 Rust 之 间 需 要 传递 更 加 复杂 的 类 型 ， 可 以 使 用 C 语言 
中 的 不 透明 数据 类 型 (Opaque) 和 Rust 中 的 Box< 工 > 相对 应 。 ”如 代 
码 清单 13-83 所 示 。 

代码 清单 13-83: 在 srclib.rs 中 新 增 代 码 


L3. 
16. 
Lis 
Le F 
19. 
Z\). 


= 
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} 


use std? i collections : sHashMae: 
pub struct Database { 
datas HashMap=<String, us2-, 
} 
impl Database { 
fn new() -> Database { 
Database { 


data: HashMap::new(), 


} 
fn insert(&mut self) { 
Tor 1 1n Orel « 
Let Zin = Termatl ("4 20a, a}? 


self Gaba. asert (zip; i) J 


} 
fn Gen(gselt, Zips &Str) => u32 { 
self.data.get(zip).cloned().unwrap or (Q) 


代码 清早 13-83 中 定义 了 结构 体 Database， 包 含 HashMap 三 String， 
u32 二 类 型 的 字段 ， 用 于 模拟 一 个 数据 库 ， 并 且 定 义 了 new 函数 ， 以 及 
insert 和 get 方法 。 其 中 new 疯 数 用 于 创建 Database 实 例 。 男 外 的 insert 
方法 则 默认 往 结构 体 实例 中 插入 1000000 个 形 如 “" 100086 " => 100086 
”的 键 值 对 ， 其 中 字符 串 关 型 为 键 ， 数 字 类 型 为 值 。get 方 法 则 是 根据 传 
入 的 字符 串 ， 取 出 对 应 的 值 。 

注意 ， 这 里 的 Database 结构 体 是 需要 传递 给 C 代码 使 用 的 ， 但 是 
为 什么 这 里 没有 使 用 #[repr (C) ] 来 保证 其 内 存 布局 是 C-ABI 兼 容 


We? KATE “C 代 码 中 ， 要 使 用 抽象 的 结构 体 类 型 与 其 相对 应 ， 并 非 一 

个 具体 的 结构 体 类 型 。 这 种 抽象 的 结构 体 类 型 叫 作 不 透明 数据 类 型 。 
如 何在 C 代 人 码 中 使 用 该 结构 体 及 其 方法 昵 ?如 代码 清单 13-84 所 未 。 
代码 清单 13-84: 继续 在 srclib.rs 中 新 增 代 码 


1. #[no mangle] 

2« pub extern fn database new() -> *mut Database | 
Sie Box::into raw(Box: :new (Database: :new() ) ) 

4. } 

5. #[no mangle] 

6. pub extern fin database insert (ptr: “mut Database) { 
Ta let database = unsafe { 

8. asSercltlptrals NOLL) 2 

9 &mut *ptr 

LK y Fs 

Lia database.insert(); 

Lee d 


13. #[no mangle] 


14. pub extern fn database query(ptr: *const Database, 


L3; ZI: "gonst © char) => © vint 
15s 4 

‘ie á let. database = unsate 1{ 

L8. assert! (Iptr.is null()); 

Los &* per 

LQ « }; 

2 。 let zip = unsafe 

ŽA s assert! (Izip-iíis nulit{)})z 

23 CStri sirom per (zip) 

24. F 

AG 。 let. Zip SCE = 2ip.to Str) .unwrap{) i 
26. database..get(zip str) 

Zle J 


28. #[no mangle] 


22. DUS @xtern Iñ database Tree (ptr: "Mut Database) 1 


SY « LE ptr.is mull() { return | 
Sd y unsafe { Box::from raw(ptr); | 
See | 


在 代码 清单 ”13-84 ”中 定义 了 三 个 外 部 函数 接口 : database_new. 
database_insert 和 database_query， 分 别 对 应 Database 绪 构 体 的 new、insert 


和 get。 

G2 ~ 447 FE X J database_newK 2M, JR EER 4! ee *mut 
Database， 代 表 Database 结 构 体 实例 的 原生 可 变 指 针 。 因 为 在 C 代 码 中 使 
用 的 不 透明 数据 类 型 实际 上 是 一 个 指针 。 国 数 体内 先 使 用 Database: : 
new 了 国 数 创建 了 结构 体 实例 ， 然 后 使 用 Box: : new 函 数 将 其 装 箱 ， 最 后 
使 用 Box: : into raw 生成 *mut Database 类 型 原生 指针 返回 。 将 Database 
的 结构 体 实例 放 到 扒 内 存 ， 古 为 了 拥有 稳定 的 内 存 地 址 ， 因 此 传递 给 
C 使 用 是 安全 的 。 

代码 第 5 一 27 行 分 别 定 义 了 database_insert 和 database_query 方 法 ， 主 
要 是 对 结构 体 实例 中 的 HashMap<String, u32> i774 A PAE MERE © 
这 里 需要 注意 的 是 ， 第 一 个 参数 *mnut Database 指 针 需 要 转换 为 引用 才 可 
以 调用 Database 的 实例 方法 。 

(RAG 28~ 3247 E X. S database free 函数 ， 因 为 推 内 存 是 在 Rust? 
分 配 的 ， 所 以 必须 由 Rust 来 释放 。 在 C 代 人 码 中 调用 该 函数 束 可 以 释放 
Box 分 配 的 堆 内 存 。 注 意 ， 释 放 内 存 的 操作 也 很 简单 ， 只 需要 将 原生 指 
针 转 换 为 Box 类 型 即 可 ， 因 为 Box 拥 有 上 所有权 ， 在 该 函数 调用 完毕 会 目 
动 释放 把 相应 的 推 内存 。 

接 下 来 ， 束 可 以 在 lib/callrust.h 头 文件 中 声明 这 些 图 数 接 口 ， 如 代码 
清单 13-85 所 示 。 
代码 清单 13-85: 在 srccallrust.h 头 文件 中 声明 新 的 函数 接口 
/ /省 略 其 他 函数 声明 

typedef struct database S database ti 
database t * database new(void); 
void database free(database t *); 


void database insert(database t *); 


oT ti te set hs Fe 


uint32 t database query(const database t *, const char *z1p); 
代码 清单 13-85 中 第 2 行 定 义 了 抽象 结构 体 database_S 和 database_t 类 
型 ， 也 吏 是 前 面 提 到 的 不 透明 数据 类 型 ， 它 实际 上 是 一 个 指针 。 
然后 在 c_srcmain.c 文 件 的 main 函 数 中 调用 这 些 函 数 ， 如 代码 清单 
13-86 所 示 。 
代码 清单 13-86: 在 c_srcmain.c 文 件 的 main 函 数 中 新 增 调用 代码 


es 


// 省 略 其 他 代码 
database t *database = database new(); 
database insert (database) ; 
NEIL t popl = database query (database, "10186") ; 
Hintes E pope = database query (database, "LOSS2"); 
database free (database) ; 
i printr("sad\n"~ BoBZ = popl) i 

执行 make 命 令 ， 人 代码 正 币 编译 运行 ， 并 输出 预期 结束 为 “666”。 

第 三 方 工具 介绍 

在 前 面 编写 Rust 中 调用 C 函 数 的 代码 时 ， 午 复 最 多 的 工作 束 古 在 
extern 块 中 声明 外 部 函数 接口 。 而 在 号 C 中 调用 Rust 的 代码 时 ， 重 复 最 
多 的 工作 束 是 在 头 文 件 中 增加 外 部 函数 接口 。 

于 是 社区 中 出 现 了 一 些 工 具 可 以 玫 助 开 及 者 目 动 完成 以 下 这 些 工 
作 : 

.rust-bindgen QL ， 该 库 可 以 根据 头 文件 自动 生成 Rust FFI 的 C 绑 
定 ， 也 文 持 部 分 C++ 功能 。 

. cbindgen L ， 该 库 可 以 根据 Rust 代 码 自动 生成 头 文件 。 

-ctest 18! ， 该 库 可 以 为 Rust FFI 的 C 绑 定 自动 生成 测试 文件 。 

使 用 这 三 个 库 ， 束 可 以 提升 FFI 的 开 友 效率 。 喝 多 的 使 用 细 市 可 以 
参考 它们 的 文档 。 

万 外 ， 针 对 移动 平台 ， 也 有 两 个 库 推荐 : 

- cargo-lipo L?! ， 提 供 cargo lipo 命 令 ， 自 动 生成 用 于 iOS 的 通用 库 。 

. jni L101] ， 提 供 Rust 的 JNI 绑 定 ， 用 于 和 Android 平 台 交 互 。 

Rust 用 于 iOS/Android 平 台 时 ， 涉 及 交叉 纺 详 ， 要 注意 议 置 相关 的 
target 格 式 。 


13.3.3 使 用 Rust 提 升 动态 语言 性 能 


— oT wae CF BB 二 


使 用 Rust 可 以 为 Ruby、Python、Node.js 等 动态 语言 编写 本 地 扩展 。 
在 Rust 诞 生 之 前 ， 普 遇 使 用 C 和 C++ 为 动态 语言 编写 扩展 ， 但 是 存在 内 
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以 保证 性 能 ， 还 能 提升 内 存 安全 。 

动态 语言 都 有 目 己 的 虚拟 机 ， 上 所 以 调用 Rust 代 人 码 不 可 能 像 C/C++ 那 
样 可 以 二 接 链 接 Rust 的 链接 库 获 取 相 关 的 图 数 调 用 信息 。 所 以 ， 动 态 语 
言 提 供 的 FFI 基本 都 是 基于 libffi EKES HCR BEJ, WE 
C-ABI 的 链接 库 都 可 以 直接 梓 动 态 调用 。 访 jb 值 库 是 动态 语言 虚拟 机 和 
二 进 制 的 一 道 桥 桨 。 

为 Ruby 写 扩展 

在 Ruby 语 言 中 ， 可 以 使 用 ffi gem 来 编写 扩展 。 继 续 使 用 callrust 项 目 
的 示例 ， 在 根 目 录 下 创建 Ruby 目 录 ， 并 在 其 中 创建 database.rb 文 件 ， 然 
后 编写 扩展 代码 。 如 代码 清单 13-87 所 示 。 

代码 清单 13-87: 在 Ruby/database.rb 中 添加 Ruby 代 码 


1. require 'ffi' 

2 class Database < FFI::AutoPointer 
3 def self.release (ptr) 

4 Binding.free (ptr) 

Ss end 

6 def insert 

7 Binding.insert (self) 

8 end 

9 def query (zip) 

LO « Binding.query(self, zip) 
11. end 

LA « module Binding 

La extend FFI::Library 


Le fii. Jab ™.../barget/debug/1libcalirust.dylib" 


LS, attach function :new, :database new, [], Database 


L a attach function free, database free, [Database], :void 

Lis attach function :insert, :database insert, [Database], :void 
18. attach function :query, :database query, 

19. [Database, :string], :uint32 

EU a end 

21. end 


22. database = Database::Binding.new 
23. database.insert 
24. popl = database.query ("10186") 
25. pop2 = database.query ("10852") 
26. puts DODA - popl 

代码 清单 13-87 是 在 Ruby 中 调用 Rust 中 定义 的 Database 及 其 方法 。 为 
it, SLA YS ffi gem. 

代码 第 2 一 11 行 定义 了 继承 于 FFI: : AutoPointer 的 Database 类 。 在 
FFI: : AutoPointer 中 定义 了 一 个 selfrelease 方 法 ， 访 方法 会 被 Ruby 的 
GC 目 动 调用 ， 以 达到 回收 内 存 的 目的 。 本 看 在 Rust 里 分 配 内 存 融 必须 
由 Rust 来 释放 的 原则 ， Database iMt Ezk self.release 方 法 ， 指 定 了 一 
个 Rust 的 回调 方法 来 清理 内 存 。 同 时 也 定义 了 insert 和 query 实 例 方 法 ， 
包 闻 了 Rust 的 函数 调用 。 

WAG 12~20 行 定义 了 Binding 模 块 。 该 模块 通过 extend 方 法 混入 
(Mixin) FFI: : Library 模 块 ， 束 可 以 使 用 的 层 lib 付 的 功能 ， 动 态 调 用 
Rnust 的 链接 库 中 的 方法 。 其 中 代码 第 14 行 通过 ffi lib 方法 指定 了 Rust 共 
享 库 OL 〈 此 处 用 动态 链接 库 ) 的 位 置 。 然 后 通过 attach_function 方法 

将 Rust 共 至 库 中 的 函数 绑 定 为 Ruby 中 的 方法 。 

代码 第 22 一 26 行 在 Ruby 中 调用 这 些 方法 。 执 行 该 Ruby 文 件 ， 程 序 
可 正确 运行 。 

在 Rust 社 区 也 提供 了 一 些 工 具 帮 助 开 发 者 更 方便 地 编写 Ruby 扩 展 ， 
罗列 如 下 : 

Ruru 和 Rutie ， 均 是 Rust 实 现 的 Ruby 虚 拟 机 接口 绑 定 ， 把 Ruby 中 
的 各 种 内 置 数据 类 型 、 关 定义 等 都 进行 了 封 荫 ， 方 便 编 与 Ruby 扩 展 。 

Helix  ， 同 样 是 对 Ruby 虚 拟 机 接口 的 绑 定 ， 但 是 其 实现 了 一 个 


Ruby 运 行 时 ， 使 用 起 来 可 以 和 Ruby 进 行 无 颖 对 接 ， 更 加 方便 。Helix 还 
实现 了 helix-rails gem 用 于 文 持 Rails 框 架 ， 使 用 它 可 以 方便 地 在 Rails 中 引 
入 Helix 与 的 Ruby 扩 展 。 

这 三 个 工具 虽然 方便 ， 但 都 存在 一 个 问题 : 束 是 在 Rust 中 创建 的 
Ruby 对 象 ， 如 果 放 到 蕉 内 存 中 再 传递 给 Ruby 中 调用 ，Ruby GCH AEM IZ 
对 和 象 的 存在 ， 这 样 势必 会 引起 内 存 泄 漏 、。 解 决 办 法 也 比较 简单， 比如 
可 以 将 这 些 Ruby 对 象 用 Rust 中 的 固定 长 度数 组 包 囊 起 来 传 给 Ruby， 
为 回 定 长 度数 组 是 在 栈 上 。 

为 Python 与 扩展 

同样 ， 也 可 以 为 Python 写 Rust 扩 展 。 以 Python 3 为 例 ， 只 需要 使 用 
内 置 的 CTypes 模 块 束 可 以 。 基 于 夺 层 lib 人 的 能 力 ，CTypes 模 块 可 以 直 
Fe MAK HE A C-ABIA FE FF 

在 callrust 项 目 根 目录 中 创建 Python 文件 夹 和 database.py 文 件 ， 并 编 
写 代 人 码 ， 如 代码 清单 13-88 所 示 。 

代码 清单 13-88: 7EPython/database.py # i Ji Python{tt4 


Oo wilh dai os wh 
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#!/usr/bin/env python3 
import sys, ctypes 
from ctypes import © char p, c_uint32, Structure, POINTER 
prefix = {'win32': ''}.get(sys.platform, '../target/debug/lib') 
extension = {'darwin': '.dylib', 'win32': '.dll'} \ 
.get(sys.platform, '.so') 
class DatabaseS (Structure): 
pass 
lib = ctypes.cdll.LoadLibrary (prefix + "callrust" + extension) 
lib.database new.restype = POINTER (Databases) 
lib.database free.argtypes = (POINTER(DatabaseS), ) 
lib.database insert.argtypes = (POINTER(DatabaseS), ) 
lib.database query.argtypes = (POINTER(DatabaseS), c char p) 
lib.database query.restype = c_uint32 
class Database: 
def init (self): 
self.obj = lib.database new() 
def enter (selr) : 
return self 
def exit. (Self, exc type, exc value, traceback) : 
lib.database free(self.obj) 
def insert (self): 
lib.database insert (self.obj) 
def query(self, zip): 
return lib.database query(self.obj, zip.encode('utf-8") ) 
with Database() as database: 
database.insert () 
popl = database.query ("10186") 
pop2 = database.query ("10852") 
print (pop2 - popl) 
代码 清单 13-87 中 第 2、3 行 导入 了 CTypes 模块 及 需要 的 类 型 。 
代 但 第 4 一 6 行 定 义 了 Rnust 共 时 库 所 在 位 置 。 广 总， 这 里 做 了 路 乎 台 


处 理 。 


代码 第 7 一 8 行 定义 了 空 类 DatabaseS， 是 为 了 在 后 面 使 用 。 

代码 第 9 一 14 行 ， 使 用 CTypes 模 块 中 的 方法 动态 加 载 共 至 库 ， 并 且 
为 共 诗 库 中 外 部 接口 函数 的 参数 和 返回 值 指 定 了 类 型 。 利 用 ”CTypes 模 
RAJ “POINTER 函数 将 空 类 DatabaseS 转 换 为 指针 类 型 ， 如 果 不 用 
DatabaseS 作 为 参数 ， 则 POINTERS Æ TIET o 

代 但 第 15 一 25 行 定义 了 Database 关 。 除 稚 认 的 构造 方法 、insert 和 
query 外 ， 还 使 用 了 _enter 和 ”exit 方法 ， 这 是 为 了 让 Database 类 的 
ARH Awith 方法 。with 方 法 可 以 定义 一 个 上 和 下文 管 理 右 。 当 出 现 with 
语句 的 时 候 ， 对 象 的 _enter “方法 会 被 触及 ， 其 返回 值 会 被 赋 值 给 as 声 
明 的 变量 。 代 码 执行 完 之 后 ，_ exit 方法 被 触发 进行 最 后 的 清理 工 
(dee 
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数 。 整 个 代码 将 正确 执行 ， 并 且 在 执行 完毕 后 ， 会 触发 _exit 方法 调 
用 Rust 中 的 database free 方 法 来 释放 内 存 。 

与 Ruby 类 似 ， 社 区 中 也 提供 了 一 些 第 三 方 的 工 上 其 文 持 更 方便 地 为 
Python 开 发 Rust 扩 展 : 

- rust-cpython , Python f% xM] Rust. x #FPython 2.7 和 和 
Python 3.3+. 

-PyO3 ， 同 样 是 Python 解释 器 的 Rust 绑 定 ， 由 rust-cpython 分 文 
演化 而 成 ， 但 比 rust-cpython 更 好 用 。 

两 者 有 本 质 的 不 同 ，PyO3 性 能 更 快 ， 并 且 更 方便 扩展 。 

为 Node.js 写 扩展 

众所周知 ，Node.js 非 常 擅长 处 理 JO， 但 是 如 果 业 务 中 包含 计算 密 
集 的 操作 会 严重 影响 到 性 能 ， 比 如 网 络 服务 中 UREL 解 机 ， 随 独 流量 上 
升 ，CPU 的 占用 惑 会 越 来 越 多 。 通 币 ，Node.js 文 持 使 用 C++ 编写 原生 模 
块 来 解雇 这 个 问题 。 但 是 既然 现在 有 了 更 现代 化 的 工具 Rust， 残 可 以 用 
它 人 花费 比 以 前 更 少 的 成 本 来 编写 更 有 效 、 更 安全 的 原生 模块 。 

Node.js 在 V8.0 之 前 ,一般 使 用 NAN (Native Abstractions for 
Node.js) 通用 API 来 开发 原生 模块 。 但 是 在 V8.0 版 本 中 加 入 了 全 新 的 
N-API 接口 ， 相 比 NAN, N-API 提供 了 兼容 C-ABI 的 接口 ， 消 除了 
Node.js p, tA GR S JavaScripts] BN AF. 


在 callrust 项 目 中 创建 Node.js/database.js 文 件 并 编写 代码 ， 如 代码 清 


单 13-89 所 示 。 
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代码 清单 13-89: 在 Node.js/database.js 中 添加 代码 
const ffi = require('ffi-napi'); 
const lib = ffi.Library('../target/debug/libcallrust.dylib', { 


database new: [‘pointer', []], 

database free: ['void", ["pointer’|]; 

database insert: ["vo1d’, ["pointer’]], 

database query: ['uint32", ['pointer”, "string']], 


}); 

const Database = function() { 
this.ptr = lib.database new() ; 

} ; 

Database.prototype.free = function() { 
lib.databese Tres (THIS prt): 

i 

Database.prototype.insert = function() { 
lib.database insert (this.ptr)? 

}; 

Database.prototype.query = function(zip) { 
return lib.database query(this.ptr, zip); 

} 

const database = new Database(); 

ERY { 
database.insert(); 
const popl = database.query ("10186") 
const pop2 = database.query ("10852") 
console.log(pop2 - popl); 

}finally { 
database.free(); 


} 
代码 清单 13-89 中 ， 第 1 一 7 行使 用 了 佳 -napi 包 加 载 Rust 共 至 库 ， 为 


其 中 的 函数 参数 和 返回 值 指定 了 Node.js 中 相应 的 类 型 。 其 中 ， 值 -napi 包 


支持 N-API 接 口 U2, 

代码 第 8 一 10 行 定义 了 一 个 JavaScript 类 Database， 并 将 指针 
lib.database_new 返 回 的 指针 指定 给 了 ptr 属 性 。 

代码 第 11 一 19 行 通过 prototype 属 性 分 别 为 Database 添 加 free、insert 
和 query 方 法 ， 对 应 于 Rust 共 宇 库 中 的 database_free、database_insert 和 
database_query。 

代码 第 20 一 28 行 创建 Database 实 例 ， 并 且 在 try 块 中 调用 实例 方法 。 
在 finally 块 中 调用 database.free 方 法 是 为 了 你 证 Rust 中 定义 的 对 象 可 以 得 
到 正确 释放 。 然 后 执行 此 代码， 得 到 预期 结果 。 

同样 ， 社 区 中 也 提供 第 三 方 工 具 来 提升 Node.js 写 Rust 扩 展 的 效率 ， 
其 中 最 党 用 的 束 古 Neon 。 

Neon 由 Rust 实 现 的 安全 快速 的 本 地 Node.js 模 块 绑 定 。 它 提供 了 
JavaScript 关 型 的 包 竣 ， 以 及 工程 化 的 命令 行 工 具 ， 可 以 极 大 地 提升 开 肥 
者 的 效率 。 但 要 注意 ， 目 前 Neon 撒 层 还 是 基于 NAN 接 口 ， 还 未 适 配 N- 
API. 

为 其 他 语言 写 扩展 

际 Ruby、Python 和 Node.js 外 ， 男 外 一 种 构建 于 Erlang 虚 拟 机 BEAM 
的 动态 语言 Elixir 也 文 持 使 用 Rust 进 行 扩展 。 

Elixir 写 原生 扩展 的 能 力 是 继承 目 Erlang 语 言 的 NIF (Native 
Implemented Function) ) 功能。NIF 人 允许 Erlang 动 态 加 载 C 语 言 的 动态 库 
到 进程 空间 中 《〈 和 jlibfi 功 能 差不多 ) ， 可 以 拥有 和 C 接 近 的 性 能 。 但 是 
NIF 编 写 的 扩展 安全 性 不 高 ， 如 果 产 生 了 上 段 错误 (使 用 C/C++ 比较 容 匈 
产生 段 错误 ) » PWSSRNIF A, GEM SBC PErlang kE ANLAR it o 
Erlang E MALUR S MWA Erlang 所 之 来 的 可 徘 、 容 错 等 特性 都 
将 烟消云散 。 所 以 ， 使 用 Rust 可 以 有 效 地 解决 编写 NIF 扩 展 安全 性 不 局 
的 问题 。 

Rust 社区 括 供 了 一 个 方便 开 及 者 编 与 安全 NIF 扩展 的 工具 Rustler 
， 使 用 它 不 会 导致 BEAM 崩 尝 ， 并 且 同 时 适用 于 Erlang 和 Elixir。 当 然 ， 
优先 适用 于 Elixir。 更 多 的 内 容 可 以 参考 Rustler 时 文档 和 示例 。 

通过 FFI，Rnust 还 可 以 和 其 他 很 多 语言 打交道 ， 包 括 Java、Swfit、 
Lua、Haskell 和 OCmal 等 。 社 区 中 也 存在 如 下 方便 的 开 及 工具 : 


-jni-rs ，Rust 的 JNI 绑 定 ， 用 于 和 Java 通 信 。 
` rlua ，Rust 的 Lua 比 定 ， 用 于 和 Lua 通 信 。 

rmal ，Rust 的 OCmal 绑 定 ， 用 于 和 OCmal 通 信 。 
相信 随 独 时 间 的 推移 ， 这 些 工具 会 越 来 越 丰 蜗 。 


13.4 Rust WebAssembly 


WebAssembly IPE PN SR. EWS 
是 “WASM”。 这 种 格式 背后 的 意义 在 于 ， 在 攻 种 程度 上 ， 它 将 改变 整个 
Web 的 生态 。 所 以 ，Rust 2018 的 重点 上 发展 目标 之 一 驳 是 建立 针对 便于 开 
发 WebAssembly 的 生态 工具 。 

WebAssembly 项 目 是 Google、MicroSoft、Mozilla 等 多 家 公司 联合 发 
起 的 一 个 面 同 Web 的 通用 三 进 制 和 文本 格式 项 目 。 它 的 出 现 并 不 是 为 了 
让 开发 者 手写 代码 ， 而 是 作为 C/C++/Rust 语 言 的 一 种 编译 目标 ， 这 样 就 
产生 了 一 个 巨大 的 意义 : 在 客 尸 问 提 供 了 一 种 接近 本 地 运行 速度 的 多 
种 语言 编写 代码 的 方式 。 在 采种 意义 上 ，WebAssembly 相当 于 一 种 中 
间 语 言 (IR) 。 其 实 WebAssembly 的 名 字 也 由 此 而 来 ， 残 像 汇编 
(Assembly) 语言 那样 是 所 有 语言 转换 成 机 需 但 的 通用 撒 层 语言 ， 
WebAssembly 驶 是 面 同 Web 的 汇编 。 

目前 WebAssembly 的 草 要 应 用 领域 是 在 浏 喉 姻 中 配合 JavaScript API 
提升 前 端 应 用 的 性 能 ， 虽 然 JavaScript 目前 有 很 多 优化 的 手段 ， 效 果 也 
不 错 ， 但 是 它 的 计算 性 能 还 是 很 悍 ， 对 于 一 些 计算 密集 型 场景 ， 残 可 以 
使 用 WebAssembly 来 葡 代 。 比 如 洲 戏 的 演 染 引擎 、 物 理 引 擎 ， 图 像 音 频 / 
视频 的 处 理 和 编辑 、 加 密 算 法 等 。 

WebAssembly 比 JavaScript 更 快 的 原因 主要 体现 在 以 下 几 方 面 : 

”WebAssembly 体 积 更 小 ， 下 载 和 解析 更 快 。WebAssembly 的 二 进 
制 格 式 束 是 为 了 更 适合 解析 而 设计 ， 其 解析 速度 要 比 JavaScript 快 一 个 数 
量 级 。 

- WebAssembly 不 受 JavaScript 的 约束 ， 可 以 利用 更 多 的 CPU 特性 。 
比如 64 位 整数 、 内 存 读 写 偏 移 量 、 非 内 存 对 齐 读 写 和 多 种 CPU 指 令 等 。 

生成 WebAssembly 编 译 颖 工具 链 的 优化 和 改进 。 比 如 在 Rust 中 ， 
可 以 使 用 wasm-gc 工 具 来 优化 生成 的 wasm 文 件 的 大 小 。 

WebAssembly 不 需要 垃圾 回收 。 内 存 操 作 是 手动 控制 ， 但 也 没 必 
要 担心 内 存 泄漏 的 问题 ， 因 为 WebAssembly 使 用 的 整个 内 存 空间 是 由 
JavaScript 分 配 的 ， 它 实际 上 是 一 个 JavaScript 对 象 ， 最 终 会 由 JavaScript 


的 GC 去 管理 。 

同时 ，WebAssembly 还 在 不 汤 地 悄 看 执行 效率 更 局 的 方 回 发 展 。 目 
前 WebAssembly 还 不 文 持 DOM 操 作 ， 但 是 已 经 有 了 解决 方案 ， 刺 是 依 
赖 Reference Types 42! 和 Host Bindings 14! 技术 在 WebAssembly 中 直接 
操作 JavaScripttDOM 对 象 和 调用 其 方法 。 

WebAssembly 名 称 里 虽然 包 售 了 Web， 但 其 友 展 全 今 ， 己 经 不 仪 
仅 局 限于 Web 。 为 了 将 WebAssembly 舱 入 到 不 同 的 环境 中 ， 其 规范 是 
被 拆 分 到 了 独立 的 文档 中 ， 并 区 分 了 层级 : 

:核心 层 。 定 义 WebAssembly 模 块 及 其 指令 集 的 语义 。 

APIz ” 。 定 义 应 用 程序 接口 ， 目 前 指定 了 两 个 API: JavaScript 

API 和 Web API 。 

由 此 可 看 出 ，WebAssembly 是 独立 于 Web 的 规范 ， Web 只 是 其 应 
用 的 特定 环境 ”。 事 实 上 ，WebAssembly 还 应 用 于 除 Web 之 外 的 其 他 领 
W: 加 面 图 形 化 程序 、 区 块 链 智能 合约 和 编写 操作 系统 微 内 核 。 

当然 ， 也 不 仅仅 局 限于 上 面 所 列 领 域 ， 还 有 更 多 的 想象 空间 。 随 看 
该 技术 的 发 展 ， 将 会 应 用 到 更 多 领域 。 


13.4.1 WebAssembly 要 点 介绍 


为 了 理解 WebAssembly 的 工作 机 制 ， 需 要 了 解 如 下 关键 概念 : 

模块 。 模 块 是 WebAssembly 的 基本 编译 单位 ， 一 个 .wasm 文 件 束 
是 一 个 模块 。 其 中 定义 了 各 种 疯 数 ， 可 以 被 JavaScript 加 载 调用 。 

线性 内 存 。 用 于 和 JavaScript 通 信 ， 有 是 一 个 可 变 大 小 的 

ArrayBuffer， 由 JavaScript 分 配 。WebAssembly 提 供 了 对 其 进行 操作 的 指 

表格 。 用 于 存放 函数 引用 ， 文 持 动 态 调用 函数 。 

实例 。 一 个 模块 的 实例 包括 其 在 运行 时 使 用 的 所 有 状态 ， 比 如 内 
人 存 、 表 格 和 一 系列 的 值 。 同 一 个 模块 的 多 个 实例 可 以 共 圣 相同 的 内 存 和 
表格 。 

- RETLHLAS 。WebAssembly 指 令 的 运行 是 基于 栈 式 机 和 需 定 义 的 ， 
种 类型 的 指令 都 是 在 栈 上 进行 出 栈 和 入 栈 操作 。 


文本 格式 wast 

WebAssembly 模 块 提供 两 种 格式 : 二进制 和 文本 格式 。 其 中 文本 
格式 是 基于 S 表 达 式 ， 供 人 类 读 写 ， 所 以 也 称 为 wast 。 文 本 格式 和 二 进 
制 格 式 也 可 以 通过 工具 相互 转换 。 

接 下 来 通过 手写 几 个 示例 来 了 解 WebAssembly。 本 书 使 用 
webassembly.studio Ho 在 线 WebAssembly IDE 来 编写 示例 代码 。 打 开 
webassembly.studio 网 站 ， 从 弹出 的 窗口 中 选择 Empty Wat Project, fit 
下 方 的 create 按 钮 ， 就 可 以 创建 一 个 WebAssembly 项 目 模 板 。 项 目 目 录 
如 代码 清单 13-90 所 示 。 

代码 清单 13-90: Empty Wat Project 模板 目录 

-一 README .md 
— build.ts 
—— package.json 


-一 sre 

| -一 main.html 
| 上 -一 main.js 

| -一 main.wat 


代码 清单 13-90 中 build.ts 文 件 专 门 用 于 构建 wasm 文 件 ， 并 输出 到 out 
目录 下 。 在 src 目录 中 ，main.wat 是 一 个 文本 格式 的 WebAssembly 文 件 ， 
在 构建 之 后 ， 它 生成 一 个 main.wasm 文 件 。 然 后 在 main.js 中 将 生成 的 
wasm 文 件 导 入 ， 最 终 在 main.html 中 使 用 。 
接 下 来 看 看 main.wat 文 件 中 默认 的 代码 ， 如 代码 清单 13-91 所 示 。 
代码 清单 13-91: main.wat 代 码 展示 
1 (module 
2 (func Sadd (param Slhs i32) (param Srhs i132) (result i32) 
3 get local $lhs 
4. get local srhs 
5 1.352.800) 
6 (export "add" (func Sadd) ) 
7 ) 


看 得 出 来 ， 代 人 码 清单 13-91 中 模块 被 表示 为 一 个 多 行 的 S 表 人 达 式 。 其 


BE OP HGS AE PT o FRSA PS IUR ENE 
A, Ja Hate oh EBERT ERIR. AT, ŒA 13-91 
中 一 共 可 以 分 成 三 大 市 点 : module . func 和 export . AF, modules 
然 表 示 模 块 ，func 代 表 的 是 函数 ，export 是 指 将 模块 内 定义 的 函数 导 
出 。 

在 代码 第 2 行 fanc 节 点 中 ， 定 义 了 图 数 人 签名 $add ， 以 美元 从 $ 开头 
可 以 为 参数 、 疯 数 名 或 局 部 变量 等 起 一 个 名 字 。 除 了 那些 导入 / 叶 出 的 
指令 ， 模 块 中 几乎 所 有 的 代码 部 被 划 分 到 函数 中 。 由 func 定 义 的 孙 数 签 
名 中 包含 的 头 两 个 param 届 上 扣 是 表示 疯 数 的 参数 ， 均 为 32 类 型 。 最 后 一 
个 result 节 点 代表 函数 的 返回 值 ， 同 为 i32 关 型 。 

代码 第 3 一 5 行 则 定义 了 函数 体 。 其 中 get_local 指 令 古 用 于 获取 参数 
的 值 ， 最 后 调用 i32.add 操 作 ， 表 示 将 两 个 132 类 型 的 参数 进行 相 加 ， 访 
操作 是 webAssembly 内 置 的 运算 符 只 8 。wasm 文 件 执行 是 以 栈 式 机 器 
定义 的 ，get_local 指令 会 将 它 读 到 的 参数 值 压 到 栈 上 ， 人 然后 i32.add 从 栈 
上 取出 两 个 i32 类 型 的 值 进行 求 和 ， 将 计算 结果 压 到 栈 顶 。 

代码 第 6 行 中 ，export 世 点 是 一 个 导出 声明 。 在 export 指 令 后 面 定 义 
的 “add” 是 指定 给 JavaScript 用 的 函数 名 。 

这 束 是 文本 格式 的 WebAssembly 代 人 码 ， 然 后 看 看 main.js 中 如 何 叶 
入 。 如 代码 请 单 13-92 所 示 。 

代码 清单 13-92: main.js 代 码 展 示 

1 fetch('../out/main.wasm').then(response => 

2 response.arrayBuffer () 

3 ) .then (bytes => WebAssembly.instantiate (bytes) ) 

4 .then (results => { 

sM instance = results.instance; 

6 document.getElementById("container") .innerText = 
7 Instance .Gxporte.ddda(l,.1) 

8 }) Catoh (console. Ssrror) ; 

代码 清单 13-92 中 使 用 了 fetch 方法 来 异步 加 载 编 详 好 的 
outmain.wasm 二 进 制 文件 ， 然 后 将 其 转换 成 ArrayBuffer 。 当 然 也 可 以 
使 用 XHR 来 加 载 wasm 文 件 。 


AEH WebAssembly.instantiate 方法 编译 并 实例 化 模块 ， 在 此 过 
程 中 会 导出 一 个 add 方 法 给 JavaScript 使 用 。 最 后 通过 
instance.exports.add 调用 该 方法 。 

最 终 ， 通 过 单 击 webassembly.studio 在 线 IDE 提 供 的 build&run 按 钮 ， 
编 详 并 运行 该 示例 ， 会 输出 结 采 “2 ”。 

使 用 WebAssembly 内 存 和 JaiiaScript 和 交互 

因为 WebAssembly 当 前 只 支持 让 2、i64、f32 和 f64 这 四 种 可 用 的 基 
本 类 型 ， 所 以 ， 为 了 处 理 字 和 从 串 以 及 其 他 复 洒 的 类 型 ，WebAssembly 所 
供 了 内 和 存 。WebAssembly 的 内 存 实际 上 是 一 种 可 增长 的 线性 字 节 数 
ZH, HH JavaScript 通 过 WebAssembly.Memory 接 口 来 创建 。 

接 下 来 重新 编写 main.wat， 让 其 可 以 输出 字符 串 “Hi WASM”， 如 代 
fay 13-93 FTA o 

代码 清单 13-93: 重 写 main.wat 以 便 打 印字 符 串 


1. (module 
Be (import “console” “lag" {fune Slog (param 1.32 132))) 
Sa (import "js" "mem" (memory 1)) 
Fes (data (132.const U) "Hi WASM,"™) 
二 和 (aata (1i34.C0nst BY "Tm Coming") 
Si. (func (export "writeHi") 
Ta 132.¢onst © 
B. L32. CONSE 18 
Js call Slog) 
Loe 3 


代码 清单 13-93 定 义 的 模块 中 ， 一 共 包 含 三 种 主要 有 的 节点 : import 
、data 和 func 。 

代码 第 2 行 和 第 3 行 的 import 节点 是 导入 JavaScript 的 方法 或 对 象 供 
WebAssembly 使 用 。 其 中 第 2 行 导入 console.log 方 法 ， 为 其 起 名 为 $log 。 
代 但 第 3 行 寻 入 由 JavaScript 创 建 的 内 存 ， 并 且 指 定 了 内 存 全 少 为 1 页 
(64KB) 。 寻 入 的 函数 签名 会 被 WebAssembly 进 行 静 态 检查 。 

代码 第 4 行使 用 data 指令 把 数据 写 入 到 内 存 中 。 其 中 * (i32 const 
0) "用 于 指定 在 线性 内 存 中 放置 数据 的 俩 移 量 ， 这 里 的 数字 0 代表 起 始 
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移 量 为 8， 这 是 因为 第 一 个 字符 串 “Hi WASM, ”的 长 度 为 8， 而 起 始 地 
址 是 0， 只 有 偶 移 量 设置 为 8 或 者 是 大 于 8 的 数字 ， 才 不 会 畴 盖 第 一 个 字 
AF A o 

代码 第 6 一 9 行 导出 writeHi 函 数 给 JavaScript 来 调用 。 其 中 call 指 令 调 
H y FaJavaScript A HY $log ce 2X 

接 下 来 修改 main.js， 如 代码 清单 13-94 所 示 。 

代码 清单 13-94: 重 写 main.js 


1. var memory = new WebAssembly.Memory({ initial : 1 }); 
2. function consoleLogString(offset, length) { 

cr var bytes = new Uint8Array(memory.buffer, offset, length); 
4 . var string = new TextDecoder ('utf8') .decode (bytes); 
Fi console. log (string) ; 

G J] 

7. var importObject = 1 

Sis console: { 

P log: consoleLogString 

IO, Py 

ls Jee { 

l2, mem: memory 

LSe } 

LA: Jy 

15. WebAssembly.instantiateStreaming ( 

16% fetch('../out/main.wasm'), importObject 

17. ).then(obj => { 

LS. obj.instance.exports.writeHi(); 

Las 493 


代码 清单 13-94 中 第 1 行使 用 WebAssembly.Memory 方法 为 wasm 分 
配 指定 的 1 页 内 存 。 

代码 第 2 一 6 行 实现 了 consoleLogString 函 数 ， 通 过 传 入 内 存 偶 移 地 址 
offset 和 字符 串 长 度 langth， 调 用 Uint8Array 和 TextDecoder 方法 对 
wasm 内 存 中 的 字符 串 进行 解码 ， 因 为 wasm 中 的 字符 串 只 是 原始 的 字 


“A, JAA AS Be TE JavaScript 中 使 用 。 

代码 第 7 一 14 行 定义 了 importObject， 访 JavaScript 对 象 是 用 于 导入 到 
wasm 中 使 用 的 log 方 法 和 内 存 。 与 wat 文 本 格式 代码 中 的 两 个 import 节 点 
相对 应 。 

代码 第 15 一 19 行 ， 通 过 WebAssembly.instantiateStreaming 方法 直 
接 从 故 层 进行 法 式 源码 编译 和 实例 化 模块 ， 这 是 加 载 Wasm 最 有 效 、 最 
优化 的 方法 。 

现在 蛙 击 webassembly.studio 在 线 IDE 提 供 的 build&run 按 钮 ， 代 人 码 编 
译 并 正常 运行 ， 输 出 结果 为 预期 的 “Hi WASM, I’ mComing” UZ . 

表格 与 动态 链接 

表格 ”和 内 和 存 类 似 ， 只 不 过 表格 是 必须 通过 索引 才能 获取 的 可 变 大 
小 的 数组 。 在 日 党 开 友 中 ， 经 党 需要 动态 调用 一 些 函 数 。 而 这 些 函 数 不 
能 秀 拉 存储 在 内 存 中 ， 因 为 内 存 会 把 存储 的 原始 内 容 作 为 字 节 烘 露 出 
去 。 如 果 函 数 存 储 在 内 存 中 ，wasm 就 可 以 任意 查看 和 修改 原始 函数 地 
址 ， 这 是 极度 不 安全 的 行为 。 所 以 ， 在 表格 中 存储 函数 引用 ， 然 后 返 
器 表格 的 索引 ， 通 党 为 132 类 型 。 通 过 call_indirect 指令 可 以 调用 索引 
值 ， 从 而 达到 调用 函数 的 目的 。 

多 个 wasm 可 以 实现 动态 链接 ， 模 块 实 例 可 以 共 于 相同 的 内 存 和 表 
格 。 通 过 内 存 和 表格 ， 就 可 以 实现 JavaScript 和 wasm 的 基本 互 操作 。 接 
下 来 使 用 webassembly.studio 在 线 IDE 重 新 创建 一 个 空 的 wat 项 目 。 将 默 
认 的 src/main.wat 删除 ， 重 新 创建 src/sharedO.wat 和 src/shared1.wat， 然 
后 修改 build.ts 代 码 ， 如 代码 清单 13-95 所 示 。 

代码 清单 13-95: 修改 build.ts 中 的 代码 


Le Gulp. task ("biila”, asyne () => | 

2 const data0 = await Service.assembleWat ( 

3 project.getFile("src/shared0.wat") .getData () 
4 ) ; 

B const outWasm0 = project.newFile ( 

6 "out/shared0.wasm", "wasm", true 

y E 

8 outWasm0.setData(dataQ) ; 

9 const datal = await Service.assembleWat ( 

Ly project.getFile("src/sharedl.wat") .getData () 
lige J3 

12. const outWasml = project.newFile("out/sharedl.wasm", "wasm", true); 
13. outWasml.setData(datal) ; 

Lay Ih 


将 build.ts 文 件 中 的 gulp.task 任 务 代码 修改 为 代码 清单 13-95 所 示 。 


为 现在 需要 编译 shared0.wat 和 shared1.wat 这 两 个 WebAssembly 文 件 。 
打开 Shared0.wat 文 件 编写 代码 ， 如 代码 清单 13-96 所 示 。 
代码 清单 13-96: 为 shared0.wat 编 写 代 码 

il (module 

2 (import "Js" “memory” (memory 17) 

k. (import "js" "table" (table 1 anyturc) ) 

As (elem (132.const 0) Sshared0Ofunc) 

5 (func SsharedOfunc (result 132) 

6 i32,ic0onst 0 

7 132.load) 

8 


ko J 

代码 清单 13-96 中 ， 第 2 行 和 第 3 行 寻 入 了 由 JavaScript 定 义 的 内 存 和 
表格 。 其 中 定义 的 表 中 数字 1 代表 初始 大 小 ， 表 示 访 表 中 将 存储 1 个 困 数 
引用 ， 而 anyfunc RLS EAN BR’. 

代码 第 4 行 ， 使 用 elem 指令 表示 将 $shared0func 函数 存储 到 表格 偏 
AOKI DiS Eo Belem HEM A data 操作 类 似 。 

代码 第 S~7 EM T MB$sharedOfunc ， 包 含 两 个 指令 。 首 先 创 


建 一 个 常数 0， 然 后 使 用 i32.load 指 令 从 内 存 中 获取 存储 到 常数 0 位 置 的 
值 ， 获 取 回 米 的 值 会 外 放 到 栈 项 ， 束 是 该 函数 的 返回 值 。 

然后 继续 为 shared1.wat 编 号 代码 ， 如 代码 清单 13-97 所 示 。 

代码 清单 13-97: 为 shared1l.wat 编 写 代 码 


(module 

2 (Import "js" "memory" (memory 1)) 

3 (import J “table” (table 1 anyfunc) ) 
4 (type svo1d to 132 (fune (result 132) )) 
is (Func (export MOIT) (Best 132) 

6 下 OBS G 

7 1S2<Const 42 

8 132.8tore 

9., J 

LO . call indirect (type $void to 132)) 
Liy 3 


代码 清单 13-97 中 同样 导入 了 由 JavaScript 并 创建 的 内 存 和 表格 对 
象 。 然 后 代码 第 4 行 通 过 type 指令 创建 了 一 个 函数 类 型 $void_to_i32， 访 
类 型 用 于 在 后 续 的 表格 函数 引用 调用 时 进行 类 型 检查 。 

代码 第 5 一 10 行 定义 了 导出 给 JavaScript 用 的 函数 doIt。 其 中 代 伍 第 6 
一 8 行 的 指令 等 价 于 “ (i32.store (i32.const 0) (i32.const 42) ) ”, W 
是 将 第 量 42 和 存储 到 索引 为 0 的 内 存 中 。 

代码 第 9、10 行 等 价 于 “(call_indirect (type$void_to_i32) 

(i32.const 0) ) ”, eM PRA S| WK H, en 25] HE 

是 shared0.wat 中 所 存储 的 $shared0func。 

最 后 ， 编 写 Srcmain.js 文 件 ， 在 其 中 创建 wasm 需 要 的 内 存 和 表格 ， 
并 加 载 由 Shared0.wat 和 sharedl.wat 生 成 的 wasm 二 进 制 文件 。 如 代码 清单 
13-98 所 示 。 

代码 清单 13-98: 为 main.js 编 写 代 码 


var importObj = { 

js: { 

memory : new WebAssembly.Memory({ initial: 1 }), 

table : new WebAssembly.Table({ initial: 1, element: "anyfunc" }) 


1 

2 

3 

4. 

as } 
6. }; 

7 Promise.all (| 

8 WebAssembly.instantiateStreaming ( 
9 


fetch('../out/shared0.wasm'), importOb] 


We Jy 

11. WebAssembly.instantiateStreaming ( 

12 fetch('../out/sharedl.wasm'), importOb}) 

L3. |). théen(function éesults) 1 

14. console.log(results[1].instance.exports.doIt())j; 
Low dI? 


代码 清单 13-98 中 创建 了 importObj 对 象 ， 通 过 WebAssembly.Memory 
和 WebAssembly.Table 分 别 创建 内 存 和 ie 

然后 通过 Promise.all 方法 异步 加 载 shared0.wasm 和 shared1.wasm, 
最 后 调用 实例 模块 sharedl 中 导出 的 函数 dolt。 

现在 单 击 webassembly.studio 在 线 IDE 提 供 的 puild&run 按 钮 ， 代 码 编 
译 并 正常 运行 ， 输 出 结果 为 预期 的 <42 » 18 


13.4.2 使 用 Rust 开 发 WebAssembly 


固然 可 以 手写 wat 文 本 格式 开发 wasm 模 块 ， 但 是 效率 显然 不 会 很 
高 。WebAssembly 设 计 之 初 也 是 为 了 作为 一 种 编译 目标 而 存在 的 ， 它 可 
以 作为 很 多 编程 语言 的 编译 目标 : 

- C/C++ , il 通过 EmScripten 工具 来 编译 到 wasm。EmScripten 是 
一 个 LLVM 后 端 工具 ， ， 可 以 将 LLVM 中 间 但 编 详 到 asm .js。 所 以 ， 
C/C++ 的 编译 流程 是 通过 任何 一 个 LLVM 前 端 工 具 《〈 比 如 Clang) 生成 
LLVM IR， 然 后 通过 EmScripten 生 成 asm.js， 最 后 通过 一 个 
WebAssembly 编 详 工 具 链 Binaryen 将 asm.js 生 成 wasm 二 进 制 格式 。 其 中 
asm.js 古 JavaScript 的 一 个 子 集 ， 可 以 说 它 是 WebAssembly 的 锥 形 。 在 一 


LEAN SS F¥wasmA Ml Gas A, thay EAE H asm. js KR Ë 
Rust ， 文 持 wasm 的 两 种 编 详 目标 。 
>wasm32-unknown-unknown ， 使 用 的 是 LLVM WebAssembly 
Backend 和 ]ld 链 接 器 。 
>wasm32-unknown-emscripten ， 会 继续 使 用 EmScripten， 和 
CICEF T e 
以 wasm32-unknown-unknown 目 标 为 例 ， 来 看 看 Rust 如 何 开 发 
wasm。 站 和 完 ， 需 要 搭建 wasm 的 开发 环境 。 使 用 rustup 命 令 即 可 ， 如 代码 
清单 13-99 所 示 。 
代码 清单 13-99: rustup 命 令 
S$ rustup toolchain install nightly 
S$ rustup target add wasm32-unknown-unknown --toolchain nightly 


清单 13-99 中 使 用 rustup 命令 选择 Nightly 工具 链 ， 然 后 使 用 rustup 
target add 深 加 wasm32-unknown-unknown 目 标 ，rustup 会 目 动 安 攻 所 需要 
的 环境 。 

环境 配置 好 以 后 ， 使 用 cargo new--lib 命令 创建 新 的 项 目 
hello_wasm。 先 在 Cargo.toml 文 件 中 这 加 lb 配置， 如 代码 清单 13-100 上 所 
不 。 

代码 清单 13-100: 修改 Cargo.toml 


[115] 
path = *sre/lib:rs" 
crate-type = ["cdylib"] 


然后 修改 srclib.rs 文 件 ， 如 代码 清单 13-101 所 示 。 
代码 清单 13-101: 修改 srclib.rs 
| #[link(wasm import module = "env") ] 
2 extern "C" { 
os pub fu logit(); 
4 pub th hello (ptr: "onst ws, Lent w32Z) 3 
5 


6 #[no mangle] 

F pub extern C7 Fn add onetxs 232) | 

Bis unsafe { 

9 logit(); 

10. let msg = Format! ("Helle world? {}", X + Lj; 
i hello(msg.as ptrt), msgq.lent) as vo2)y 

LZ x } 

Los if 


在 代码 清单 13-101 中 ， 第 1 一 5 行 通过 extern " C" ESA JavaScript 
中 定义 的 函数 logit 和 hello 国 数 。 其 中 logit 函数 是 打算 调用 JavaScript 中 的 
console.log 方 法 ， 而 hello 函数 是 接收 指针 和 长 度 作 为 参数 ， 目 的 是 打算 
将 Rust 中 的 字符 串通 过 wasm 传 递 到 JavaScript 中 使 有 用。 注意 ， 在 第 1 行使 
Fa Y # [link Cwasm_import_module= " env " ) ] 属性 来 指定 extern 块 的 
wasm 柑 块 名 字 为 env， 也 可 以 改 为 其 他 名 字 ， 但 如 果 不 使 用 议 属 性 ， 鸭 
认 束 是 env。 

本 质 上 ，Rust 还 是 退 过 导出 羔 容 C-ABI 的 接口 ， 经 过 LLVM 
WebAssembly Backend 的 编译 和 ]ld 的 链接 ， 最 终 输 出 为 wasm 二 进 制 。 
所 以 这 里 使 用 extern 块 。 

在 代码 第 6 一 12 行 ， 使 用 # [no_mangle] 和 pub extern" C" XK 
数 add_one , Z AASA A 132 整数 类 型 ， 在 函数 中 会 对 其 进行 指 
定 的 计算 ， 最 后 输出 一 行 字 符 串 。 该 函数 中 调用 了 logit 和 hello 函 数 。 在 
第 9 行 定义 了 msg 字 人 符 吕 变量， 然后 通过 调用 msg.as_ptr 方 法 得 到 该 字符 
时 的 原生 指针 传 给 hello 函 数 。 

接 下 来 在 hello_wasm 项 目 根 目录 下 创建 hello.html 和 hello.js 文 件 ， 并 
修改 hello.html 文 件 ， 如 代码 清单 13-102 所 示 。 

代码 清单 13-102: 修改 hello.html 文 件 


<1 DOCTYPE Weml> 
<html lang="en"> 
<head> 
<meta charset="utf-8"> 
<title>hello wasm</title> 
Ksoriok. enc="./helle,. Te be seript> 
</head> 
. hts 


代码 清单 13-102 是 一 个 简单 的 HTML 文 件 。 注 意 ， 代 码 第 6 行 引 入 了 
hello.js 文 件 。 然 后 开始 修改 hello.js 文 件 ， 如 代码 清单 13-103 所 示 。 
代码 清单 13-103: 修改 hello.js 文 件 


O = G OFF & w PV FF 


Le Vär hod; 

Ze vars imports = | 

Ta losita () => + 

4 . console.log('this was invoked by Rust, written in JS'); 
2. by 

6. hello: (ptr, len) => { 

Ta var buf = new Uint8Array ( 

2 mod.instance.exports.memory.buffer, ptr, len 

9. ) 

LY var msg = new TextDecoder('utf8"') .decode (buf); 

aS EP alert (msg) ; 

Lee g 

Wae 

14. fetch('output/small hello.wasm') 

15 .then (response => response.arrayBuffer () ) 

Lýs .then (bytes => WebAssembly.instantiate (bytes, {env: imports})) 
Led a .then (module => { 

LB mod = module; 

19, module.instance.exports.add one (41); 

204 PLE 


代码 清单 13-103 中 第 1 行 声明 了 mod 变 量 ， 代 表 加 载 的 wasm 模 块 实 
例 ， 供 后 面 使 用 。 在 代码 第 2 一 13 行 定义 了 imports 对 象 ， 包 含 了 logit 和 


hello 的 函数 定义 。 

值得 注意 的 是 ，hello 国 数 的 ptr 参数 实际 上 只 是 一 个 数字 ， 它 代表 
WebAssembly.Memory 内 存 中 数据 的 索引 。 在 该 函数 内 部 ， 通 过 
Uint8Array 和 TextDecoder 方 法 将 ptr 对 应 的 内 存 中 的 值 转换 为 JavaScript 字 
符 串 。 注 意 ，Uint8Array 的 第 一 个 参 
#(mod.instance.exports.memory.buffer “将 得 到 ArrayBuffer 对 象 以 供 操 
fee 

最 后 ， 在 第 14~20 行使 用 fetch 方法 加 载 wasm 文件 ， 并 得 到 
arrayBuffer， 通 过 WebAssembly.instantiate 将 imports 对 象 传 给 指定 的 模块 
env， 对 wasm 模 块 进 行 编 译 和 实例 化 。 最 后 调用 模块 实例 化 对 象 中 的 方 
法 add_one。 

接 下 来 束 可 以 将 Rust 代 人 码 编译 为 wasm， 在 hello_wasm 目 录 下 创建 
output 上 有 目录、， 以 便 存 放生 成 的 wasm 文 件 。 生 成 wasm 雷 要 三 条 命令 ， 如 
代码 清单 13-104 所 示 。 

代码 清单 13-104: 生成 wasm 需 要 的 三 条 命令 

$ cargo build --target wasm32-unknown-unknown 
$ cp target/wasm32-unknown-unknown/debug/hello wasm.wasm output 


$ wasm-gc output/hello wasm.wasm output/small hello.wasm 


代码 清单 13-104 中 第 一 条 是 cargo build 指 定 了 wasm32-unknown- 
unknown 作 为 target， 最 终 会 在 taget/wasm32-unknown-unknown/debug H 
录 下 生成 hello.wasm。 然 后 将 其 复制 到 output 目录 下 。 最 后 使 用 wasm- 
gc 工具 将 output/hello_wasm.wasm EAR) ETT BEY, FB 


output/small_hello.wasm 文 件 。 当 然 也 可 以 使 用 make 目 动 化 处 理 这 三 条 
命令 。 

可 以 通过 cargo install wasm-gc 安装 该 工具 。 在 网 页 中 加 载 的 wasm 
越 小 越 好 。 不 过 随 看 ld 链接 天 的 进一步 完善 ， 增 加 了 链接 时 优化 

(LTO) 功能 束 不 需要 使 用 wasm-gc 了 了。 

现在 通过 浏览 器 US! 打开 hello_wasm/hello.html， 会 看 到 弹出 窗口 
中 显示 “Hello world: 42 ”， 说 明 Rust 代 码 编 详 的 wasm 已 经 可 以 正常 使 
FA 


13.4.3 打造 WebAssembly 开 发 生态 


即便 是 使 用 Rust 编 与 代 但 再 编 详 为 wasm， 开 肥效 鞭 还 是 比较 低 。 
WebAssembly 标 准 只 定义 了 四 种 类 型 : 两 种 数字 和 两 种 浮 点 数 。 在 大 多 
数 情况 下 ， 这 四 种 类 型 完全 不 够 用 。 因 此 ，Rust 冒 方 打 造 了 以 wasm- 
bindgen 为 首 的 一 系列 工具 ， 旧 在 提升 Rust 开 及 wasm 的 体验 。 这 一 系列 
TREKAM: 

- wasm-bindgen ， 核 心 是 促进 Javascript 和 Rnust 之 间 使 用 wasm 进 行 
通信 。 它 允许 开发 者 直接 使 用 Rust 的 结构 体 、Javascript 的 类 、 了 字符 串 等 
类 型 ， 而 不 仅仅 是 wasm 文 持 的 整数 或 浮 点 数 。 开 发 者 只 需要 专注 于 他 
的 业务 即 可 。 

- Wasm-pack ， 一 站 式 构 建 、 发 布 Rust 编 详 的 wasm 人 到 npm 平 人 台 。 不 
需要 安 六 npm、node.js 等 JavaScript 环 境 ，wasm-pack 会 编译 并 优化 生成 
JavaScript 绑 定 ， 然 后 发 布 到 npm 中 。 

- cargo-generate ， 直 接生 成 wasm-bindgen 和 wasm-pack 项 目 模板 ， 
方便 开 友 。 

从 这 三 个 工具 可 以 一 向 Rust 官 方 对 Rust 和 WebAssembly 有 的 愿景 项 
望 可 以 更 方便 地 使 用 Rust 开 发 wasm， 并 且 不 需要 改变 现 有 开发 流程 


wasm-bindgen 致力 于 为 JavaScript 生态 和 Rust crate 生态 系统 建立 
共 译 的 基础 。wasm-bindgen 通过 内 置 的 js-sys 包 所 供 了 对 所 有 全 局 
JavaScript API 的 绑 定 ， 只 需要 通过 wasm_bindgen: : js 即 可 调用 。 辣 
样 ， 通 过 内 置 的 web-sys 包 提 供 了 对 所 有 Web API 的 绑 定 ， 方 便 开 发 者 
调用 。 

可 以 使 用 cargo install cargo-generate 命令 安装 cargo-generate， 安 
北 好 之 后 使 用 cargo-generate 命 令 可 以 生成 wasm-bindgen 项 目的 模板 ， 如 
代码 清单 13-105 所 示 。 

代码 清单 13-105: cargo-generate 命 令 生成 模板 项 目 

$ cargo-generate --git \ 


https://github.com/ashleygwilliams/wasm-pack-template 


此 命令 生成 的 模板 项 目 会 默认 在 Cargo.toml 文件 中 配置 好 wasm- 


bindgen。 要 使 用 wasm-bindgen， 目 前 必须 在 Nightly 版 本 之 下 先 安装 
wasm-bindgem-cli 工 具 ， 如 代码 清单 13-106 所 示 。 
代码 清单 13-106: 安装 wasm-bindgen-cjli 
S$ cargo +nightly install wasm-bindgen-cli 
£38 UF wasm-bindgen-cli T -H at Ay LME AA wasm-bindgenfis S RTT 
wasm 项 目 了 。 在 开 及 完成 之 后 使 用 wasm-pack 工 具 ， 如 清单 13-107 所 
ZN o 
代码 清单 13-107: 安装 wasm-pack 以 及 使 用 wasm-pack 打 包 命 令 
5 cargo install wasm-pack 
3 wasm-pack build 


代码 清单 13-107 PRR AN S ARME. A ORE RRC 
wasm-pack， 第 二 条 是 wasm-pack build 命令 ， 在 项 目的 根 目 录 下 执行 该 
命令 ， 了 驶 会 目 动 生成 JavaScript 相 天文 件 ， 方 便 打 包 wasm 到 npm 乎 合 。 

这 了 驶 是 Rust 的 一 站 陈 wasm 开 有 友 体 验 。 更 多 详细 的 内 容 可 以 参 往 
wasm-bindgen 的 文档 120] 和 项 目 中 的 示例 代码 。 

除 官方 外 ， 社 区 也 在 不 断 地 对 WebAssembly 进 行 探 索 ， 比 较 有 代表 
性 的 框架 有 : 

- stdweb ， 基 于 Rust 和 WebAssembly 实 现 的 web 客户 端 标准 库 。 访 
库 主 要 用 于 写 Web 客 户 端 。 未 来 可 能 会 被 web-sys 蔡 代 。 

-cargo-web , 77 (#43 Web% FP sin HJ Cargo fit > JE -o 

-yew , ATM FP vin Webby A HYRustt#£32, 4 Fstdweb¥, RE 
来 自 Elm 和 React 框 架 。 

-percy ， 实 现 了 一 个 虚拟 Dom， 可 以 根据 服务 疹 的 HIML 字 人 符 串 演 
染 到 浏览 锅 的 Dom， 完 全 同 构 ， 纯 Rust 和 Wasm 实 现 一 个 web 应用。 

ruukh ， 一 个 实验 性 的 Rust Webi mI RIEZ. 2¢Vue.js#ll 

React.js 的 局 发 ， 基 于 Rust 和 WebAssembly。 

看 来 ， 使 用 Rust 进 行 全 栈 Web 开 用 指 日 可 符 。 


13.5 小 结 


只 有 彻 抵 了 解 什么 是 不 安全 ， 才 能 对 安全 有 更 深 的 认 若 。 学 习 
Unsafe Rust 的 过 程 ， 才 能 对 Safe Rust 有 更 深 的 理解 。 从 这 个 角度 来 说 ， 
本 章 算 得 上 是 全 书 的 “点 睛 之 笔 ”。 

可 以 说 ，Safe Rust 是 构建 于 Unsafe Rust 之 上 的 。 使 用 Unsafe Rust 
味 看 编译 妖 将 不 能 百 分 百 地 保证 类 型 安全 和 内 存 安 全 ， 将 会 有 产生 未 定 
义 行为 的 风险 。Unsafe Rust 是 将 保证 安全 的 职 贡 交 给 了 开发 者 。 本 章 通 
过 深入 探讨 Unsafe Rust 编 程 中 可 能 产生 未 定义 行为 的 情况 ， 曾 述 了 如 何 
对 Unsafe 代 码 进行 安全 抽象 。 标 准 库 里 也 封装 了 很 多 Unsafe 代 但。 事实 
E, Rusti S A LEBEIE HY 2 adi lel SEAS Al Unsafet Vig A Xx « 

当然 ， 目 前 Rust 官 方 还 在 努力 构建 Unsafe ”Rust 的 内 存 模型 。 在 未 
来 ， 也 许可 以 由 Rust 编 详 医 检查 出 Unsafe 代 码 中 的 未 定义 行为 。 

为 了 和 其 他 语言 “打交道 ”"，Rust 也 提供 了 FFI， 人 允许 开发 者 非常 方便 
地 生成 车 容 C-ABI 的 库 。 本 章 通过 Rust 和 C、CPP、Ruby、Python、 
Node.js 语 言 交 互 的 示例 ， 阐 述 了 Rust 如 何 编写 FFI， 以 及 深入 理解 FFI。 

随 看 WebAssembly 技 术 的 兴起 ，Rust 在 2018 年 也 开始 以 “打造 
WebAssembly 最 佳 开发 工 其 链 ” 为 目标 发 展 。 本 章 介 绍 了 WebAssembly 
基础 ， 以 及 如 何 使 用 Rust 开 发 WebAssembly。 此 外 ，Rust 官 方 还 推出 了 
wasm-bindgen 和 wasm-pack 工 具 链 ， 为 WebAssembly 的 开 肥 提供 了 极 大 
的 便利 。 

除了 WebAssembly，Rust 还 应 用 于 众多 领域 ， 比 如 Web、 网 络 基 
人 础 、 分 布 式 系 统 、 游 戏 和 区 块 链 等 。 因 篇 幅 有 限 ， 本 书 不 能 一 一 为 读者 
展现 。 旋 者 在 学 会 Rust 之 后 ， 可 以 目 行 探索 感 兴 趣 的 领域 。 





[1] 来 目 rust-sgx-sdk 项 目 。 
[2] 官方 所 有 文 持平 台 的 目标 triple 格 式 的 列表 : https: /forge.rust-lang.org/platform-support.html. 


[3] https://doc.rust-lang.org/reference/items/external-blocks.html. 





[4] https://crates.io/crates/cc. 
[5] 本 书 代 码 的 平台 是 Linux 或 macOS . 


[6] https://github.com/rust-lang-nursery/rust-bindgen. 





[7] https://github.com/eqrion/cbindgen. 


[8] https://github.com/alexcrichton/ctest. 

[9] https://github.com/TimNN/cargo-lipo. 

[10] https://github.com/prevoty/jni-rs. 

[11] 笔者 本 地 使 用 macOS， 其 动态 共享 库 格 式 为 .dylib 。 

[12] 本 例 使 用 了 Node.js V10.7.0， 在 该 版 本 中 N-API 已 经 稳定 。 

[13] https://github.com/WebAssembly/reference-types/blob/master/proposals/reference-types/Overview.md. 











[14] https://github.com/WebAssembly/host-bindings/blob/master/proposals/host-bindings/Overview.md. 
[15] https://webassembly.studio/. 
[16] 这 里 查阅 更 多 语义 操作 https: //webassembly.org/docs/semantics/ . 
17] 完整 代码 地 址 为 https: //webassembly.studio/? f=asqnsl6ru30。 
18] 完整 代码 地 址 为 https: //webassembly.studio/? f=ottwfve7all。 
[19] 推荐 使 用 Firefox Nightly 版 本 。 


[20] https://rustwasm.github.io/wasm-bindgen/introduction.html. 


附录 A Rust 开 发 环境 指南 


Al KANE RH SEH AY Sc Rust 

不 需要 在 本 地 安装 ”Rust， 也 可 以 玩 转 ”Rust。 官 方 提供 了 在 线 的 
PlayGroud 环境 : https: //play.rust-lang.org/， 如 图 A-1 所 示 。 你 只 需要 有 
网 络 ， 打 开 浏 览 占 ， 输 入 此 网 址 ， 束 可 以 方便 地 玩 转 Rust。 


STABLE SHARE TOOLS CONFIG 





Execution Close 


Compiling playground v0.0.1 (file:///playground) 
Finished dev [unoptimized + debuginfo] target(s) in 0.55s 
Running “target/debug/playground 


Hello Rust 


图 A-1: Playground 示 意 

Rust 开 没有 提供 方便 的 交互 式 运行 (Read-eval-print-loop，REPL ) 
环境 ， 虽 然 也 有 第 三 方 库 ， 但 并 不 好 用 。 所 以 Playgroud 暂时 就 是 最 佳 
的 选择 ， 也 许 以 后 会 有 更 好 用 的 REPL 工具 。 

PlayGroud 的 功能 很 丰富 ， 你 可 以 方便 地 查看 编译 后 的 ASM、 
LLVM IR 和 MIR， 如 图 A-2 所 示 。 

单 击 MIR 按 钮 ， 残 可 以 看 到 输出 了 MIR 人 代码 。PlayGroud 还 可 以 选择 
Rust 的 不 同 版 本 ， 比 如 Stable、Beat 和 Nightly， 也 可 以 选择 编译 模式 ， 
例如 ，Debug 和 Release。 





WHAT DO YOU WANT TO DO? 


Run 
Build and run the code, showing the output. 
Equivalent to cargo run. 


Build 
Build the code without running it. Equivalent to 
cargo build. 


Test 
Build the code and run all the tests. Equivalent to 
cargo test. 


ASM 
Build and show the resulting assembly code. 


LLVM IR 
Build and show the resulting LLVM IR, LLVM's 
intermediate representation. 


MIR 
Build and show the resulting MIR, Rust's 
intermediate representation. 


== yN -o 


WASM 
Build a WebAssembly module for web browsers, in 
the .WAT textual TA 

并 A ` rre quires u! ne the Nightiy 


sieve f AJ EST. f Fg Nicht 
ALi vy DYLE UIT ILIY 


图 A-2: 可 以 选择 要 编译 的 目标 格式 

A.2 在 本 地 安装 Rust 

Rust 工 具 集 里 包 侣 了 两 个 重要 的 组 件 : rustc 和 cargo。 

“ rustc， 是 Rust 的 编译 器 。 

cargo， 是 Rust 的 包 管 理 器 ， 包 含 构建 工具 和 依赖 管理 
Rust 的 工具 集 分 为 以 下 三 类 版 本 : 
Nightly， 通 常 称 之 为 “ 夜 版 ">。 它 是 Rust 日 党 开发 的 主 分 文 ， 其 中 

包含 了 一 些 特性 是 不 稳定 的 ， 有 可 能 会 改 。 

‘Beta, With. WARN RAK, FARA Nightly 版 
本 中 被 标记 为 稳定 的 特性 

- Stable， 稳定 厂 。 该 版 本 也 是 每 六 周 及 布 一 次 ， 基 于 修复 了 已 上 友 现 


Bug 的 最 新 Beta 版 来 发 布 。 

开 及 人 员 一 般 是 基于 Stable 版 本 来 开 肥 的， 但 是 Nightly 版 本 包含 
很 多 新 的 特性 ， 一 些 第 三 方 库 有 时 也 会 用 到 Nightly 瓜 本 。 

A.2.1 安装 Rust 

Rust 为 我 们 提供 了 非 沿 方便 的 安 状 工具 : rustup， 此 工具 和 Ruby 的 
rbenv、Pvython 的 pyenv， 以 及 Node 的 nvm 关 似 。 

通过 执行 以 下 命令 来 安 闭 rustup: 

curl https://sh.rustup.rs -sSf | sh 


也 可 以 通过 参数 指定 默认 使 用 Nightly 版 本 : 
curl https://sh.rustup.rs -sSf | sh -s -- --default-toolchain nightly -y 

此 工具 是 全 平台 通用 的 ， 所 以 不 害 是 Windows， 还 是 Mac 或 
Ubuntu， 都 适用 。rustup 会 在 Cargo 目 录 下 安装 rustc、cargo、rustup， 以 
及 其 他 一 些 标准 工具 。 类 UNIX 平 台 默 认 安 装 于 $HOME/.cargo/bin， 
Windows 平 台 默 认 安 装 于 %USERPROFILE%\.cargo\bin。 

安装 完毕 ， 可 以 通过 输入 如 下 命令 检测 : 

ruste -Persio 

WR AEA LAR AS thrust ThA S , WY eee MT o 

rustup HJ LA AB By i ee RASH 2 SS PERE RAS, M rustup default 命 
令 指 定 一 个 默认 的 rustc 版 本 : 

rustc default nightly 
De 
yuste Ge6taule night Lly-2018-05-T2 

通过 指定 日 期 ，rustup ZES Bette VATE as ASR R, MR 
报错 ， 可 以 换 一 个 日 期 ， 和 直到 成 功 为 止 。 你 还 可 以 通过 执行 rustup-h 来 
查看 天 于 rustup 的 其 他 帮助 。 

A.2.2 修改 国内 源 

内 有 些 地 区 访问 Rustup 的 服务 右 不 太 顺 畅 ， 可 以 配置 中 国 科 学 技 
AK CUSTC) 的 Rustup 镜 像 。 

(1) 设置 环境 变量 。 


export RUSTUP DIST SERVER=http://mirrors.ustc.edu.cn/rust-static 
export RUSTUP UPDATE ROOT=http://mirrors.ustc.edu.cn/rust-static/rustup 


(2) 设置 cargo 使 用 的 国内 镜像 。 
在 CARGO_HOME 目 录 下 《默认 是 一 /.cargo) 建立 一 个 名 叫 config 
的 文件 ， 内 容 如 下 : 


[source.crates-1i10] 
registry = “https://github.com/rust—lang/crates.io-index" 
replace-with = 'ustc' 

[source.ustc] 

registry = "http://mirrors.ustc.edu.cn/crates.io-index" 


A.3 在 Docker 中 使 用 Rust 

在 你 的 Dockerfile 中 添加 如 下 配置 : 
FROM phusion/baseimage 
ENV RUSTUP HOME=/rust 
ENV CARGO HOME=/cargo 


ENV PATH=/cargo/bin:/rust/bin:$PATH 
RUN curl https://sh.rustup.rs -sSf | sh -s -- --default-toolchain nightly 


“了 
尔 相 


如 果 你 不 想 使 用 Nightly 版 本 ， 可 以 将 nightly 换 成 stable。 如 果 你 想 
指定 固定 的 nightly 版 本 ， 则 可 以 再 添加 如 下 一 行 命令 : 


RUN rustup default naghtily-2016-U5-12 


A.4 Rust IDE 或 编辑 器 

IDE 有 很 多 选择 ， 比 如 Visual Studio Code. IntelliJ IDEA 等 。 

当然 ， 你 也 可 以 用 你 最 熟悉 的 编辑 般 : Emacs、Emacspace、Vim、 
Atom 等 。 

A.5 开发 依赖 工具 介绍 

A.5.1 Racer 代 人 码 补 全 

Racer 是 Rust 代 人 码 补 全 库 ， 很 多 编辑 器 都 需要 安 猴 它 (Interllij IDEA 
Rust 已 经 默认 包含 了 代码 补 全 功能 ， 但 并 非 基 于 Racer， 而 是 基于 其 目 己 
实现 的 相关 语言 AST) : 


cargo install racer 


代码 补 全 需要 源 代 人 码 。 以 前 需要 下 载 源 人 代码， 手动 放 a 到 菜 处 并 定期 
更 新 ， 现 在 有 了 rustup 很 方便 : 


rustup component add rust-src 
之 后 需要 配置 环境 变量 为 : 


export RUST SRC PATH="$ (rustc --print sysroot) /lib/rustlib/src/rust/src" 


A.5.2 RLS 

RLS 是 Rust Language Server fai 3, (arte saree BARA as HIA 
念 ， 将 IDE 的 一 些 编程 语言 相关 的 部 分 由 单独 的 服务 右 来 实现 ， 比 如 代 
伺 伞 全 、 跳 转 定 义 、 奉 看 文档 等 。 这 样 ， 不 同 的 IDE 或 编辑 右 只 需要 实 
Pyle A ime O BW AY o 

RLS 是 Rust 官方 提供 的 ， 不 过 现在 只 有 Visual Studio Codex fF, Jf 
且 需 要 在 系统 中 安装 nightly 版 本 的 Rust (AYA) 。 

RLS 的 安装 请 查阅 项 目 README Ul ， 也 是 rustup 轻 松 完成 。 但 因 
为 目前 部 分 功能 还 依赖 于 racer 来 实现 ， 需 要 配置 racer 的 坏 境 变量 (不 必 
TE) 。 

A.5.3 cargo 插件 

作为 Rust RY ASA CA, cargo ERX HAIK EE, build, X 
MAB. AAS Pesce, KEY CE a eR Lae 
是 必 装 的 cargo 插件 。 

clippy 

可 以 分 析 你 的 源 代 码 ， 检 枉 代 人 码 中 的 Code Smell。 可 以 通过 rustup 工 
Azz 8 clippy © 

rustup component add clippy 


rustfmt 


可 以 帮助 你 统一 代码 风格 ， 团 队 开 及 中 推荐 使 用 。 使 用 cargo 可 以 
方便 地 安 冯 : 


rustup component add rustfmt 


cargo fix 


从 1.29 版 本 开始 ，Cargo 目 带子 命令 cargo fix， 可 以 帮助 开发 者 目 动 
修复 编译 副 中 有 敬告 的 代码 。 





[1] https://github.com/rust-lang-nursery/rls#setup. 


附录 B Rust 如 何 调试 代码 


本 文通 过 调试 Rust 语 言 的 一 个 安全 漏 铜 来 展示 Rust 如 何 调试 代 但 。 
Rust 语 言 在 2018 年 9 月 上 明光 过 一 个 安全 漏洞 ， 编 号 为 CVE-2018-1000657 
[1 。Rust 官 方 的 GitHub 仓 库 也 有 issues LH 的 相关 讨论 。 

该 漏洞 的 成 因 如 下 : 

混用 了 VecDeque< 工 > 容 硕 中 “逻辑 ?容量 和 “物理 ?容量 引发 的 
UB. 

:Rust 产 生 segfault 的 条 件 ， 正 十 因为 产生 了 UB。 

:Rust 里 产生 UB， 只 可 能 是 在 Unsafe Rust 之 下 。 

这 个 UB 是 因为 馆 辑 漏洞 导致 指针 错乱 ， 然 后 导致 sd: : ptr: : 
write 指针 畴 兰 了 合法 数据 。 但 这 个 不 是 段 错误 的 原因 。 

”Rust 在 函数 执行 完 之 后 ， 目 动 执 行 术 构 函数 ， 也 了 吏 是 VecDeque 的 
析 构 函数 ， 其 中 也 用 到 了 unsafe， 因 为 指针 是 销 乱 上 时， 那么 析 构 也 错乱 
了 。 析 构 错 乱 导 至 合法 的 内 存 数 据 被 释放 ， 发 生 Segfault。 

接 下 来 使 用 LLDB 对 相关 issues 中 的 代码 进行 调试 ， 以 便 验证 漏洞 
分 析 是 否 正 确 。LLDB 是 macOS 平 台 下 的 工具 ， 命 令 和 Linux 平 台 的 GDB 
基本 相似 。 

B.1 环境 配置 

首先 ， 使 用 rustup install 1.20.0 命令 安 猴 好 有 漏 铀 的 Rust 版 本 。 
il As EH rustup default 1.20.0 选 择 该 版 本 为 Rust 默 认 版 本 。 

有 关 调 试 工具 ， 笔 者 使 用 的 是 VSCode ， 需 要 安装 CodeLLDB 插件 

(Mac 环 境 ，Linux 请 用 GDB 相 关 ) 。 环 境 配 置 好 之 后 ， 使 用 cargo new 
lldb demo 命令 在 src/main.rs 文件 中 保存 issues 中 相关 的 示例 代码 。 
代码 大 致 如 下 : 


ao oO Ff WN F&F 


use stdzs:imt; 
use std::collections: :VecDeque; 
pub struct Packet 
{ 
pub payload: VecDeque<u8>, 


Ja pub struct Header 


8. { 

9. pub data: Vec<ué&>, 

Le 了 

11. // 4% 

12. impl Header 

J 

14. pub fn new() -> Self 

La { 

16. let data = Vec: wich capacity (20) ; 
17. Header{data} 

18. } 

19. // 4% 

20: |} 

Zl. fn. pushi TEv (packet: Smut. Packer) 

ZZ, 4 

23. // AR 

24. } 

Zo. TN. pusi mat (Packets emut Packet) 

26. { 

21. Let mut header = Headertiawith capacity (30) ; 
28. // 4% 

29. printlin! ("new packet = {:?}", packet); 
30. } 

3l. Ér måáinm{) 

Ses 4 

i ie let mut packet = Packet: :new(); 

34. push ipv4(&mut packet); 

3m. push mac(&mut packet) ; 

36. J 


完整 代码 可 以 在 随 书 源码 srwappendixlldb.rs 中 找到 。 当 然 ， 你 可 以 
使 用 lldb 命 令 进行 调试 ， 安 装 rust-lldb， 但 是 不 如 使 用 VSCode 方 便 。 如 
图 B-1 所 示 ， 在 VSCode ”Debug 措 面 选择 好 配置 ， 可 以 直接 选择 Add 
Configuration.…. 来 添加 新 的 配置 。 


hh DEBUG JY Debug tests in tao-of-rust 


4 VARIABLI Add Configuration... 





图 B-1: 在 VSCode Debug 界 面 选择 配置 


如 图 B-2 所 示 ， 在 选择 Debug 配 置 时 ， 只 需要 选择 ”LLDB: Debug 
Cargo Output 束 可 以 目 动 配置 。 然 后 ， 束 可 以 开始 进行 调试 了 。 


: Connect to server 

: Launch file 

: Launch package 

: Launch test function 
: Launch test package 


: Attach by Name 

: Attach by PID 

: Custom Launch 

: Debug Cargo Output 
: Debug Cargo Tests 
: Launch a New Process 
js: Attach 





图 B-2: 选择 Debug 配 置 
B.2 调试 代码 
经 过 前 文 的 分 析 ， 己 经 知道 在 哪里 设置 断 点 。 如 图 B-3 所 示 ， 在 
main ac Pie Wr, KAT eee main 函数 调用 结束 后 的 术 构 函数 
中 。 当 然 ， 只 有 这 两 个 断 点 是 不 够 的 。 但 是 可 以 开始 进行 调试 了 。 


let mut packet = Packet: :new(); 


(&mut packet); 
(Smut packet); 





选择 Debug 界 面 ， 并 单 击 该 界面 左上 和 角 的 绿色 三 角形 按钮 ， 束 可 以 
开始 调试 代 但 。 

如 图 B-4 所 示 ， 刚 开始 绥 慢 单 击 Step Over (F10) 投 钮 ， 
elt A A “STAAL 


= main W 


main.rs — lidb_demo 


let fcs = [@xD9, @x58, OxFB, OxA8]; 

println!("old packet = {:?}", packet); 

println! ("pushing {:X} {:X} {:X} {:X} ", fes({@], fes[1], fcs[2], fes[3]); 
packet. push_back_bytes(&fcs); 


printin!("new packet = {:?}", packet); 


in() 


let mut packet = Packet: :new(); 
ipv4(&mut packet); 
mac(&mut packet); 


tH ce Wed 12 





直到 程序 执行 完 main 世 数 ， 有 结果 输出 为 如 图 B-5 所 示 ， 


let mut packet = Packet: :ne 
4(&mut packet); 
c(&mut packet); 


DEBUG CONSOLE 
Disploy settings: variable formrteouto, show disassembly-cuto, numeric pointer values=off, container susmaories=on, 
Launching /Users/blockanger/work/box/dota/apps/rust/1ldp_demo/target/debug/11db_deno 
old pocket = G0 88 @1 oz 83 & 05 06 G1 z 83 H OS 06 01 0z 83 BH 85 06 & 37 03 BO 45 14 00 14 6a 15 B17 
pushing D9 58 FE Ag 
new packet = @@ 8E @1 O82 03 G4 05 Ob 0l G2 03 © 05 06 01l G2 83 4 05 06 O 37 03 BO 45 14 00 14 0a 15 00 17 00 58 FE AB 





AIB-5: 单 击 Step (F10) 按钮 直到 有 结果 输出 为 止 


此 时 观察 YSCode 侧 边 Sr STACKE: A, DESANN: 


4 CALL STACK PAUSED ON STEP 
lldb_demo: :main main.rs 
panic_unwind: :__rust_maybe_catch_panic 


std: :panicking: :try<(),closure> @10... 


Std: :panic: :catch_unwind<cLosure,(Q)> ( 
std::rt::Lang_start @1000127c0..10... 
main @7100008ae0..100008b10 14 
start @/7fff7851e014..7fff7851eOld 4 





eee 一 个 知识 点 ， 
. main 函 数 执行 的 时 候 ，Rust 提 供 了 一 个 很 小 的 运行 时 std: : rt: 
lang_start， 会 将 main 函 数 作为 一 个 财 包 传 进去 。 
:lang_start 文 持 Gloabl Heap ik EIH x fF main PA Zt WR H y 
panic， 则 会 由 它 来 负责 恢复 。 
Rust 是 基于 LLVM 的 ， 实 际 上 弄 稍 处 理会 分 为 两 个 阶段 : 搜索 阶 
段 和 清理 〈cleanup) 阶段 。 在 搜索 阶段 ， 会 检查 panic, FAE ni 


医 它 。 在 清理 阶段 ， 会 决定 到 后 运行 哪个 (如 果 有 的 话 〉 清理 代码 对 当 
六 堆栈 进行 清理 。 它 会 调用 析 构 函数 和 内 存 释 放 等 。 
表面 分 析 漏 铜 的 成 因 ， 可 能 是 因为 馆 辑 Bug 导 致 术 构 函数 释放 了 合 
法 的 内 存 ， 进 而 引起 段 错误 。 现 在 调试 是 想 确 认 到 底 是 不 是 这 个 原因 。 
所 以 需要 在 rt: : lang_start 调用 的 时 候 打 上 上 断 点 ， 这 样 才 可 以 更 精细 地 
调试 到 后 层 的 每 个 细节 。 所 以 需要 单 击 CALL STACK 柱 中 的 std: 
rt: : lang_start， 这 时 调试 界面 会 跳 转 到 一 个 汇编 界面 ， 在 默认 选中 的 
那 行 代 但 设置 好 断 点 ， 如 KIB- Re 


A: . 48 8D 7D CO 
: 48 89 C6 
2961: E8 7A C3 FF FF 
00012966: 48 C7 45 AQ 00 00 00 00 
E: 48 C7 45 A8 00 00 00 00 
: 48 8D 45 98 
i: 48 89 45 BO 
E: 48 8D 3D EB F9 FF FF 


: 48 8D 75 Be 


4 CALL STACK 


: 48 8D 55 AQ 
DOMC USAn Putt etch vic s ` 48 8D 50 AB 
AGr ARC T @1 L4 : 48 89 D9 
td: :paric: :cotch_wrwind<c losure,( > 
std: set: : long stort @1000127c0..10 
100008900. 100008510 14 isplay settings: vorieble formoteauto, show discssemblyeouto, numeric pointer volueseoff, container sumoriese-on 
Launching /Users/blockenger/work/box/dota/apps/rust/1 1a@_demo/torget/debug/11a>_demo 
old pocket = 00 ES Ol 02 G3 04 05 0G G1 02 03 OF 05 0G 01 02 03 O4 05 06 OD 37 03 90 45 14 09 14 OF 15 © 17 
pushing 09 58 FR AS 
mw pocket = OO 8S 01 02 O3 O4 OS 0G 0i 02 O3 O4 OS oG 01 02 03 O4 05 06 O0 37 03 20 45 14 00 14 00 15 00 17 00 58 FR A3 


Lig óo: aain 


DEBUG CONSOLE 


ort @711785i1e014..711785ie0ld 4 





AIB-7: 在 CALL STACK 中 选中 std: : rt: : lang_start 并 设置 断 点 


此 时 再 次 单 击 Step Over 应 该 会 跳 入 汇编 界面 ， 如 图 B-8 所 示 。 


DBLO p Dosog ia tum | © 


+ VARIABLES 


100004CE0: 
100004CE1: 
100084CE4: 
100004CE8: 
100004CEC: 
100004CF0: 
100004CF5:; 
100004CF9: 
100004CFA: 
100004CFB: 


@100004ce0.. 10000440C 


55 

48 89 ES 
48 83 EC 
48 89 7D 
48 8B 7D 
ES 3B FF 
48 83 C4 
SD 

(3 

OF 1F 44 


arbp 
arsp, *rbdp 


$0x10, “rsp 
Sardi, -0x8(%rbp) 
“§x8(arbpo), rdi 
0x 100004¢30 
$0x10, %rsp 
arbp 


(rax, rax) 


s CALL STACK 
core: ptr: :drop_in_ploce<1L@_deno: | Pech 


Lidd 2801 ATA 


Pa ON athe 


manse 162 
-La a rust ADOG Cotch pani c 

std: panicking: itry), closure @10 

std: (panic: cote wingeelosure (> 6 we 

Displey settings: veritable formot-euto, show disassembly-cuto, sumeric pointer velues-off, contciner sumories-on. 
Lounching /Vsers/>lockerger/work/box/dote/apps/rust/|ldb_demo/terget/debug/ | ldd deno 

old pocket = @8 83 @) G2 G3 Ot OS 0 Ol G2 GS O GS 06 Gl G2 OS Ot GS 06 OO 37 G3 8845 14 14 1S 

pushing 09 58 FO AS 

mn pocet = 2 ee ee ee ee ee Re ee ee Bee ee Be Ble Bre Be eS 


std: Pt Long stert @1000177¢0..10 
asin @10000Gae0..100008D10 tM 
stort @71178610014.. 7111786000 4 





图 B-8: 单 击 Step Over (F10) 按钮 跳 到 汇编 界面 
此 时 使 用 Step Into (F11) 按钮 ， 单 步 了 递 进 调试 代码 。 看 到 左 侧 
CALLSTACK 调 用 栈 已 经 执行 到 了 core: : ptr: : drop_in_placerk 2, 
这 应 该 是 VecDeque 调 用 析 构 函数 ， 正 在 释放 内 存 。 继 续 Step Into， 会 看 


色 万 外 一 个 core: 


[ER 网 p Detupichdeme 1 从 
J VARIABLES 
# Local 
» {tat :Mm Bead} 
+ Static 
1 gid 
i hegiters 


a CALL STACH Pauded te im 
tore: opr: sdrop_ in placal lec: vic dag 


cece; ptr: Grom inp Lace<| ide dees: 5 Pack 


ptr: 


: drop_in_place 函 数 调用 ， 如 图 B-9 所 示 。 


本 MO MCRL 


100804038: 
106004C31: 
1OOUH4CS4; 
100004C38:; 
da: 
1808904C48: 
10000445: 
100884C47: 
100004C4B: 
160004C4C: 
180084C4D: 
108804C50: 
18800454: 
1080004C57: 


55 pushq %rbp 
48 89 ES 

48 83 EC 28 

46 89 7D E8 

48 8B 7D EË 

E8 18 26 08 00 Lig 
EB 27 jmp Ox 180004 cbe 
48 83 C4 28 adda $0x20, ‘rsp 
50 popa srep 

家 | retg 
88 45 FB mov | 
46 86 7D Fe mova 
89 45 E4 

E8 76 56 03 80 


‘rsp, ‘Srbp 

$ex20, Srsp 

‘edi, -0x18(%rbp) 
~“Ox18(Srbp), rdi 
011002072608 


“Ox8(%rbp), seax 
=—§xl0(%rbp), Ardi 
heax, ~Oxic(%rbp) 
Ox18803a2d4 


a Sear; secre mains 152 
ponie wind: rusi arte omtch parit 
sid: ipomicking: try) cloure E0 
sid: pasic: ieot uwina osure, (> f 
stds Pts: long stort GoTo. 00, 

agin 性 Te MOAT mw 
at Basted etal d 


图 B-9: 





188084C5C: 48 EB 45 EB 


=8xl8(%rbp), Yrax 


DELG COKSOLF 


Gisplay settings: vorioble formeteowto, shos disssseably=guto, mæeric pointer valuet-off, combtoiner summarieseon, 
Launching Users Dlackonger,mork/ boo date wpe Pent) Leb deme, target, dete l ld dee 

old pocket = p a pi alaz asa oiai a BKB eM OT Oe 45 ia 14 15 aa 17 

pushing OS So FS ag 

hw pachet = G0 35 Gi aT ga w o5 goai gz oa ot BAHAR eo OT oa K a5 ia gg i4 pa 15 00 17 00 55 FE AF 


单 击 Step Into (F11) 看 到 执行 了 另外 一 个 drop_in_place 函 数 


现在 回顾 一 下 VecDeque 函 数 的 析 构 函数 定义 。 


1. // VecDeque<T> 析 构 函 数 

Z. unsafe impl<#[may dangle] T> Drop for VecDeque<T> 1 
< fn drop(é&mut self) { 

4. let (front, back) = selfsas mut slices () s 
Dj unsafe { 

6. // 调用 [T] 的 析 构 函数 

T. ptrs :drop in place (front) ; 

8. piry:drop an place(back) ; 

9, } 

iD. // RawVec REA HARK 

dbs } 

Les J 


看 来 此 时 代码 已 经 释放 了 VecDeque 的 内 存 。 但 是 此 时 代码 还 在 正 
并 未 报 出 段 错 误 。 上 所以， 继续 使 用 Step Into 单 步 递 进 调试 ， 友 
drop 开 始 调 用 ， 如 图 B-10 所 示 。 


O000r260. 1000072b0 区 一 


VIZ, -从 一 一 


P 1T, 
Ey VecDeque: 


CUS p Debaidb demo + OF 6 





= VARIABLES 
ilo 
t ftoil:3t, head:4} 


» CALL STACK 
giles rwec_dequeri{{impi}iiidrapads i 


core; ipiri irop Un plies iggi: vec cag 


Paudid Ow gtit 


cere: ptr: drop. lA_plocecl Lab, demo: : Pack 
lid demo; pein Ts 153 


ponic ural; 5 ret sowie cot por 


100007260: 
100007261; 
100007204; 
100007268: 
10000726C; 
1080007270: 
100007274; 
108007278; 
10800727C; 
LQQGBT2TF: 
188007284: 
100007288: 
10800728C: 
100007290; 


TAARAIIOA à 


55 

48 89 E5 

48 83 EC 50 
48 8D 45 Eð 
48 89 7D BO 
48 8B 7D BƏ 
48 89 7D B8 
48 88 75 BB 
48 89 C7 


Es iC B4 FF F 


48 8B 45 Eð 
48 8B 4D EB 
48 89 45 CO 
48 89 40 C8 


AR OR 45 FA 


DUG CONSOLE 


pushq *rbp 

movg ‘‘srsp, Arp 

subg  $8x50, rsp 

leag 4 ~Ox20(%rbp), *rax 

movg %rdi, -0x50(%rbp) 
=§x58(%rbp), *rdi 
rdi, ~8x48(4rbp) 
-x48 (rdp), %rsi 
‘rax, *rdi 

i 8x10@0026a0 

=§x20(%rbp), rax 
-0x18 (arbo), srcx 
trax, —Ox40(Srbp) 
rcx, -0x38 (rbp) 
NE raz 


Display settings: verloble format-outo, show disossembly-auto, mumeric polmter volues-off, contelner summor es=5, 
Lane hi ng Alpers/blockonper/‘eork/‘boe/dote/opps/ rust] ldo dma torpat dibap Leb deng 

old packet = 09 55 Ql az 03 Si 05 05 01 z 03 D RoR gl a a H Bea ee a5 14 oa oaa 

puibing 09 SE FE AS 

na pocket = 0O ES g1 G2? 83 Bt 05 06 Ol A OS w g5 gG oLa 03 OS Oe I7 oa po a5 14 Oa li eS ga i7 OSB FE OAS 


std: (pricking: treya j cloure Gi 

itd: pariti :detch_urwindicloture,( i i 
šti: rt ong stort @i000177c0_ t0. 
mA 和 Htc 和 ow 
start 人 


AIB-10: 单 击 Step Into (F11) 看 到 执行 了 vec_deque: : droprk 2X 
继续 使 用 Step Into, AcHidropreh WHT EE, ARIB IKIH IE IST, 
Wi HA BSc tg TRAN E TET PY PBI BACT EN RACE © ARSE Yd Tak o 





ALA 4 A aemain ee AEAT. TERT AS RATE, main BOR E 
之 前 ，Rust 会 将 内 存 再 归还 给 操作 系统 。 那 么 接 下 来 运行 的 代码 应 该 都 
是 做 这 一 部 分 工作 。 在 调试 过 程 中 ， 还 可 以 通过 左上 角 的 VARIABLES 
栏 观 察 函 数 调 用 中 变量 值 的 变化 ， 如 图 B-11 所 示 。 


4 VARIABLES 
4 Local 

>» self: {cap:0} 
4 Static 


« Global 
4 Registers 
» General Purpose Registers: {rax:0Ox000. 


Tinka? + oD 


4 WATCH 





图 B-11: 在 Step Into 过 程 中 ， 通 过 VARIABLES 窗 口 观察 变量 值 的 变化 
这 个 调试 过 程 需要 比较 长 的 时 间 ， 在 这 个 过 程 中 ， 还 能 看 到 
VecDeque JJH] RawVec 在 析 构 图 数 调 用 之 后 ， 多 雇 调用 dealloc_buffer 
来 释放 内 存 ， 如 图 B-12 上 所 示 。 


as 1000039AF: 48 8B 85 60 FF FF FF nova -Oxa® drop 
100003986: 48 89 45 98 MOVA “fax, —Ox/0( sop) 
10000398A: E8 F1 29 00 00 Bllq 0x1000063b0 
10000398F: 48 80 7D C0 Leaqg -Ox40(4rbp), *rdi 
10008039C3: 48 80 75 EQ leag <-@x20(%rbp), “rs 
1000039C7: 48 8B 85 78 mova ~Ox88(%rbp), 
1009039CE: 48 8B 50 68 nova OxB(%rax), %r 
100003902: E8 59 2B 00 alla @x100006530 
100003907: 48 8D 7D A8 Leaq ~Ox58(%rbp), 
100003908: 48 8D 75 CO eaq «= -Ox40(%rbp), arsi 
10000390F; ES 4C E6 FF 0x100002030 
1000039E4; 48 80 55 Fe Lead -0x10 (rbp), *rdx 
1000039E8: 48 8B 45 AB nova -Ox58(4rbp), rax 
1000039EC: 48 8B 4D BO mova =-@x5@(%rbp), *rcx 
1000039F0: 48 89 45 98 movq %rax, ~8x68(%rbp) 
1000039F4: 48 89 4D AQ nova ‘*rcx, —8x60(%rbdp) 





+ CALL GTACK Parto On bier 
#\ loc! iron vecs IT LO 7 deel lo bef ferat.a 


allo nom _ vec i {{impl}}; draped.) loc: heop 


core: (ptr: :drop_in_plecees! loc: iros vec: Rose 1000@039F8: 48 8B 85 78 FF FF FF mova ~OxB8(%rbp), *rax 
ve: 

é DEBUO CONSOLE 

nr Displey settings: vorioble formet-cuto, stow discssembly-cuto, numeric pointer volues-off, comtciner svemeries-on 
anata Launching /Users/dlLockanger/work/ban/dota/apps/rust/| ldb_demo/target/debug/11@_ der 

old pocket = 00 48 G1 G2 03 & OS 06 G1 G2 G3 & GS 06 G1 G2 G3 G+ 05 G6 OO 37 G3 88 45 14 14 O15 © 17 

100 pushing 09 58 FS As 

> mw pecket wm ee ee ae ee SO ee Se Se ee ee ee Rete eee Bee Be eee Be et 
0 1000" 
A WA J 





图 B-12: 在 Step Into 过 程 中 ， 能 观察 到 多 次 dealloc_buffer 被 调用 


继续 调试 ， 会 看 到 heap: : dealloc 被 调用 ， 这 意味 着 堆 内 存 被 释 
放 ， 如 图 B-13 所 示 。 


4 CALL STACK PAUSED ON STEP 
alloc: :heap::{{impl}};::dealloc @100006d... 


alloc: :raw_vec: :{{imp1}}::dealloc_buffer<u8,al 


alloc: :raw_vec::{{imp1}}::drop<u8,alloc: :heap: 
core: : ptr: :drop_in_place<al Loc: : raw _vec: :RawVe 


core: :ptr::drop_in_place<al loc: :vec_deque: :Vec 





图 B-13: 在 Step Into 过 程 中 ， 看 到 heap: : dealloc 被 调用 


还 会 看 到 jemalloc 的 相关 函数 被 调用 ， 如 图 B-14 所 示 。 


4 CALL STACK PAUSED ON STEP 
alloc_jemalloc::contents::.rdedealloc @... 
alloc: :heap::{{imp1}}::dealloc @100006d... 
alloc: :raw_vec: :{{imp1}}: :dealloc_buffer<u8,al 
alloc: :raw_vec: :{{imp1}}: :drop<u8,alloc: :heap: 





core: :ptr::drop_in_place<al loc: :row_vec: :RawVe 


图 B-14: 在 Step Into 过 程 中 ， 看 到 jemalloc 的 dealloc 方 法 被 调 用 


在 Rust 1.20 中 ，Rust 的 默认 内 存 分 配器 是 Jemalloc， 这 里 调用 
dealloc， 意 味 看 Jemallloc 把 内 存 归 还 给 操作 系统 。 直 到 此 时 ， 代 码 依旧 


y — 


正常 运行 。 
直到 最 后 的 清理 阶段 完成 之 后 ， 代 码 骨 涡 了 ， 让 VSCode 出 现 了 死 
锁 ， 如 图 B-15 所 示 。 


a +} UD . 

44: 48 8D 7D B8 
pthread mutex lock @7fff7883434c..7ft1788 : E8 13 B7 FF FF 
std: :sys::imp: mutex: :i{{inpl}}: ilock @10 Jooo! iD: BE 18 00 60 00 
std: :sys_common: :autex::{{{epl}}::lock @1 2000E752: BA OB 00 BB BO 


std: :to::lery::{{ieol}}:: init: :{{closure}}<ste 


+ CALL STACK PAUSED ON EXCEPTION 


~ DESUG CONSOLE 
olloc’ :bored::{{isol}}: :coll.bore(). closure 


olloc: :bowed: :{{impl}}::collonce<f), O> Disploy settings: vortable formot-cuto, show disassembly-cuto, 
«i f f P Ale t 
;Rk | @10. Lounching /Users blockanger/work/box/data/apps rust/1ldéb_demo/te 
old pocket = O08 88 @1 02 03 G4 O05 06 01 02 G3 Ət 05 06 01 02 的 


sys common: :cleonup::{{closure}} @10 pushing 09 58 FB AS 


:isyne:conce::{{impl}}::coll_once::{{closur new pocket = 00 58 @1 G2 03 64 05 06 01 G2 G3 Ət 05 06 01 G2 03 
sync: :once::{{{apl}}::cell_inner @10 Stop reosom: EXC_BAD_ACCESS (code=1, oddress=@x8) 
idle square sane» i ttmal AR Stop reason: EXC_BAD_ACCESS (code~1, aoddress-@x®) 
« BREAKPOINTS 





© Rust: on panic 
图 B-15: {RIZA 


下 到 执行 完 std: : syscommon: : at_exit_imp: : cleanup 之 后 ， 


段 错 误 才 发 生 。std: : syscommon: : at_exit imp 是 rt 运行 时 的 最 后 退 
出 阶段 ， 此 时 代码 执行 完毕 ， 要 将 内 存 归 还 给 操作 系统 。 
同时 ，VSCode LLDB Debug LEMAH J EXC_BAD_ACCESSHIR, 
并 且 此 时 代码 调用 停留 在 pthread_mutex_lock 调 用 处 。 
pthread_mutex_lock 其 实 是 调用 libc 库 中 的 一 个 系统 API， 己 经 到 操作 系 
统 底层 了 。 抛 出 EXC_BAD_ACCESS 错 误 一 般 是 由 “调用 了 已 经 释放 的 
内 存 空 间 ， 或 者 说 重复 杰 放 了 茶 个 地 址 空间 ?而 引起 的 。 
分 析 到 这 里 ， 真 相 已 经 浮 出 了 水 面 。 
B.3 总 结 
(1) 前 文中 分 析 段 错误 产生 的 原因 经 过 了 LLDB 的 实证 。 
(2) 因为 容量 使 用 错误 ， 导 致 指针 混乱 。 
(3) 在 main 函数 析 构 函数 调用 之 后 ， 因 为 指针 混乱 ， 将 不 该 释放 
的 内 存 释 放 掉 了 。 但 是 此 时 并 未 发 生 panic。 
(4) 在 main 函数 退出 运行 时 的 时 候 ， 需 要 将 内 存 归 还 给 操作 系 
统 。 此 时 调用 了 另外 一 个 cleanup 方 法 ， 在 给 操作 系统 归还 内 存 的 过 程 
中 ， 通 过 抛 出 的 错误 EXC_BAD_ACCESS 分 析 ， 应 该 是 调用 了 本 来 不 该 
释放 但 已 经 释放 的 内 存 空 间 。 
(5) 错误 发 生 在 操作 系统 接口 pthread_mutex_lock 中 ，Rust 根 本 无 
HE, ATOM AEB HR. 





[1] https://cve.mitre.org/cgi-bin/cvename.cgi?name=% 20C VE-2018-1000657. 
[2] https://github.com/rust-lang/rust/issues/44800. 


